Hổ Sĩ ĐÀM (Chủ biên) 

ĐỖ ĐỨC ĐÔNG - LÊ MINH HOÀNG - NGUYỄN THANH HÙNG 


TÀI LIỆU GIÁO KHOA 

CHUYÊN TIN 

QUYÊN 2 


NHÀ XUẤT BẢN GIÁO DỤC VIỆT NAM 




Công ty Cổ phần dịch vụ xuất bản Giáo dục Hà Nội - Nhà xuất bản Giáo dục Việt Nam 

giữ quyền công bố tác phẩm. 

349-2009/CXB/43-644/GD Mã số : 8I746H9 


2 




LỜI NÓI ĐẦU 


Bộ Giáo dục và Đào tạo đã ban hành chương trình chuyên tin học cho các 
lớp chuyên 10, 11, 12. Dựa theo các chuyên đề chuyên sâu trong chương trình 
nói trên, các tác giả biên soạn bộ sách chuyên tin học, bao gồm các vấn đề cơ 
bản nhất về cấu trúc dữ liệu, thuật toán và cài đặt chương trình. 

Bộ sách gồm ba quyến, quyến 1, 2 và 3. cấu trúc mỗi quyến bao gồm: phần 
li thuyết, giới thiệu các khái niệm cơ bản, cần thiết trực tiếp, thường dùng nhất; 
phần áp dụng, trình bày các bài toán thường gặp, cách giải và cài đặt chương 
trình; cuối cùng là các bài tập. Các chuyên đề trong bộ sách được lựa chọn mang 
tỉnh hệ thống từ cơ bản đến chuyên sâu. 

Với trải nghiệm nhiều năm tham gia giảng dạy, bồi dưỡng học sinh chuyên tin 
học của các trường chuyên có truyền thống và uy tín, các tác giả đã lựa chọn, 
biên soạn các nội dung cơ bản, thiết yếu nhất mà mình đã sử dụng đế dạy học 
với mong muốn bộ sách phục vụ không chỉ cho giáo viên và học sinh chuyên 
PTTH mà cả cho giáo viên, học sinh chuyên tin học THCS làm tài liệu tham khảo 
cho việc dạy và học của mình. 

Với kinh nghiệm nhiều năm tham gia bồi dưỡng học sinh, sinh viên tham gia 
các kì thỉ học sinh giỏi Quốc gia, Quốc tế Hội thỉ Tin học trẻ Toàn quốc, 
Olympiad Sinh viên Tin học Toàn quốc, Kì thi lập trình viên Quốc tế khu vực 
Đông Nam Á, các tác giả đã lựa chọn giới thiệu các bài tập, lời giải có định 
hướng phục vụ cho không chỉ học sinh mà cả sinh viền làm tài liệu tham khảo 
khi tham gia các kì thi trên. 

Lần đầu tập sách được biên soạn, thời gian và trình độ có hạn chế nên chắc 
chắn còn nhiều thiếu sót, các tác giả mong nhận được ỷ kiến đóng góp của bạn 
đọc, các đồng nghiệp, sinh viên và học sinh đế bộ sách được ngày càng hoàn 
thiện hơn . 

Các tác giả 
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Chuyên đề 6 


KIỂU DỮ LIỆU TRỪU TƯỢNG 
VÀ CẤU TRÚC DỮ LIỆU 


Kiêu dừ liệu trừu tượng là một mô hình toán học với những thao tác định nghĩa 
trên mô hình đó. Kiêu dừ liệu trừu tượng có thê không tôn tại trong ngôn ngữ 
lập trình mà chỉ dùng đê tông quát hóa hoặc tóm lược những thao tác sẽ được 
thực hiện trên dừ liệu. Kiểu dữ liệu trừu tượng được cài đặt trên máy tính bằng 
các cấu trúc dữ liệu: Trong kỹ thuật lập trình cấu trúc (Structural 
Programming), cấu trúc dữ liệu là các biến cùng với các thủ tục và hàm thao 
tác trên các biến đó. Trong kỹ thuật lập trình hướng đối tượng (Object- 
Oriented Programming), cấu trúc dừ liệu là kiến trúc thứ bậc của các lóp, các 
thuộc tính và phương thức tác động lên chính đối tượng hay một vài thuộc tính 
của đối tượng. 

Trong chương này, chúng ta sẽ khảo sát một vài kiêu dữ liệu trừu tượng cũng 
như cách cài đặt chúng bằng các cấu trúc dữ liệu. Những kiểu dữ liệu trừu 
tượng phức tạp hơn sẽ được mô tả chi tiết trong từng thuật toán mỗi khi thấy 
cần thiết. 

1. Danh sách 

1.1. Khái niệm danh sách 

Danh sách là một tập sắp thứ tự các phần tử cùng một kiểu. Đối với danh sách, 
người ta có một số thao tác: Tìm một phần tử trong danh sách, chèn một phần tử 
vào danh sách, xóa một phần tử khỏi danh sách, sắp xếp lại các phần tử trong 
danh sách theo một trật tự nào đó v.v... 

Việc cài đặt một danh sách trong máy tính tức là tìm một cấu trúc dữ liệu cụ thế 
mà máy tính hiểu được đế lưu các phần tử của danh sách đồng thời viết các đoạn 
chuông trình con mô tả các thao tác cần thiết đối với danh sách. 
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Vì danh sách là một tập sắp thứ tự các phần tử cùng kiểu, ta ký hiệu TElement 
là kiểu dữ liệu của các phần tử trong danh sách, khi cài đặt cụ thế, TElement có 
thế là bất cứ kiểu dữ liệu nào đuợc chuông trình dịch chấp nhận (Số nguyên, số 
thực, ký tự, ...). 

1.2. Biếu diễn danh sách bằng mảng 

Khi cài đặt danh sách bằng mảng một chiều , ta cần có một biến nguyên n lưu số 
phần tử hiện có trong danh sách. Neu mảng được đánh số bắt đầu từ 1 thì các 
phần tử trong danh sách được cất giữ trong mảng bằng các phần tử được đánh số 
từ 1 tới n: A — a[l ...n] 

a) Truy cập phần tử trong mảng 

Việc truy cập một phần tử ở vị trí p trong mảng có thế thực hiện rất dễ dàng qua 
phần tử a p . Vì các phần tử của mảng có kích thước bằng nhau và được lưu trừ 
liên tục trong bộ nhớ, việc truy cập một phần tử được thực hiện bằng một phép 
toán tính địa chỉ phần tử có thời gian tính toán là hằng số. Vì vậy nếu cài đặt 
bằng mảng, việc truy cập một phần tử trong danh sách ở vị trí bất kỳ có độ phức 
tạp là 0(1). 

b) Chèn phần tử vào mảng 

Đe chèn một phần tử V vào mảng tại vị trí p, trước hết ta dồn tất cả các phần tử 
từ vị trí p tới tới vị trí n về sau một vị trí (tạo ra “chỗ trống” tại vị trí p), đặt giá 
trị V vào vị trí p, và tăng số phần tử của mảng lên 1. 

procedure Insert(p: Integer; const v: TElement); 

//Thủ tục chèn phần tữ V vào vị tríp 
var i: Integer; 

begin 

for i := n downto p do a[i + 1] := a[i]; 

a[p] := v; 

n : = n + 1; 

end; 

Trường hợp tốt nhất, vị trí chèn nằm sau phần tử cuối cùng của danh sách 
(p = n + 1), khi đó thời gian thực hiện của phép chèn là 0(1). Trường hợp xấu 
nhất, ta cần chèn tại vị trí 1, khi đó thời gian thực hiện của phép chèn là 0(n). 
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Cũng dề dàng chứng minh được rằng thời gian thực hiện trung bình của phép 
chèn là 0(n). 

c) Xóa phần tử khỏi mảng 

Đe xóa một phần tử tại vị trí p của mảng mà vẫn giữ nguyên thứ tự các phần tử 
còn lại: Trước hết ta phải dồn tất cả các phần tử từ vị trí p + 1 tới n lên trước 
một vị trí (thông tin của phần tử thứ p bị ghi đè), sau đó giảm số phần tử của 
mảng (n) đi . 

procedure Delete(p: Integer) ; //Thủ tục xóa phần tử tại vị trí p 
var i: Integer; 

begin 

for i := p to n - 1 do a[i] := a[i + 1]; 
n : = n - 1; 

end; 

Trường hợp tốt nhất, vị trí xóa nằm cuối danh sách (p = rì), khi đó thời gian 
thực hiện của phép xóa là 0(1). Trường hợp xấu nhất, ta cần xóa tại vị trí 1, khi 
đó thời gian thực hiện của phép xóa là 0(n). Cũng dề dàng chứng minh được 
rằng thời gian thực hiện trung bình của phép xóa là 0(n). 

Trong trường hợp cần xóa một phần tử mà không cần duy trì thứ tự của các phần 
tử khác, ta chỉ cần đưa giá trị phần tử cuối cùng vào vị trí cần xóa rồi giảm số 
phần tử của mảng (n) đi 1. Khi đó thời gian thực hiện của phép xóa chỉ là 0(1). 

1.3. Biểu diễn danh sách bằng danh sách nối đơn 

Danh sách nối đon (Singly-linked list) gồm các nút được nối với nhau theo một 
chiều. Mồi nút là một bản ghi (record) gồm hai trường: 

• Trường info chứa giá trị lưu trong nút đó 

• Trường link chứa liên kết (con trỏ) tới nút kế tiếp, tức là chứa một thông tin 
đủ đế biết nút kế tiếp nút đó trong danh sách là nút nào, trong trường hợp là 
nút cuối cùng (không có nút kế tiếp), trường liên kết này 
được gán một giá trị đặc biệt, chang hạn con trỏ nil. 

type 

PNode = A TNode; //Kiểu con trỏ tới một nút 
TNode = record; //Kiểu biến động chứa thông tin trong một nút 
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info: TElement; 
link: PNode; 

end; 

Nút đầu tiên trong danh sách ( head ) đóng vai trò quan trọng trong danh sách nối 
đon. Để duyệt danh sách nối đon, ta bắt đầu từ nút đầu tiên, dựa vào truờng liên 
kết đế đi sang nút kế tiếp, đến khi gặp giá trị đặc biệt (duyệt qua nút cuối) thì 
dừng lại 


b l=ì)~ v »l 7 ÉkJ 7 1 1=D 


head 


Hình 1.1. Danh sách nối đơn 


a) Truy cập phần tử trong danh sách nối đơn 

Bản thân danh sách nối đon đã là một kiểu dữ liệu trừu tuợng. Đe cài đặt kiểu 
dữ liệu trừu tuợng này, chúng ta có thế dùng mảng các nút (truờng link chứa chỉ 
số của nút kế tiếp) hoặc biến cấp phát động (truờng link chứa con trỏ tới nút kế 
tiếp). Tuy nhiên vì cấu trúc nối đon, việc xác định phần tử đứng thứ p trong 
danh sách bắt buộc phải duyệt từ đầu danh sách qua p nút, việc này mất thời 
gian trung bình 0(n), và tỏ ra không hiệu quả nhu thao tác trên mảng. Nói cách 
khác, danh sách nối đon tiện lợi cho việc truy cập tuần tự nhung không hiệu quả 
nếu chúng ta thực hiện nhiều phép truy cập ngẫu nhiên. 

b) Chèn phần tử vào danh sách nối đơn 

Đe chèn thêm một nút chứa giá trị V vào vị trí của nút p trong danh sách nối 
đon, truớc hết ta tạo ra một nút mới NewNode chứa giá trị V và cho nút này liên 
kết tới p. Neu p đang là nút đầu tiên của danh sách ( head ) thì cập nhật lại head 
bằng NewNode, còn nếu p không phải nút đầu tiên của danh sách, ta tìm nút q 
là nút đứng liền truớc nút p và chỉnh lại liên kết: q liên kết tới NewNode thay vì 
liên kết tới thẳng p (h. 1.2). 
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b íâKl c d e lá) 


head 



NewNode 


Hình 1.2. Chèn phần tử vào danh sách nối đon 

procedure Insert(p: PNode; const v: TElement); 

//Thủ tục chèn phần tử V vào vị trí nútp 
var NewNode, q: PNode; 

begin 

New(NewNode); 

NewNode A .info := v; 

NewNode A .link := p; 

if head = p then head := NewNode 

else 

begin 

q := head; 

Víhile q A .link í p do q := q A . link; 
q A .link := NewNode; 

end; 

end; 

Việc chỉnh lại liên kết trong phép chèn phần tử vào danh sách nối đon mất thời 
gian 0(1), tuy nhiên việc tìm nút đứng liền trước nút p yêu cầu phải duyệt từ 
đầu danh sách, việc này mất thời gian trung bình 0(n). Vậy phép chèn một phần 
tử vào danh sách nối đon mất thời gian trung bình 0(n) đế thực hiện. 

c) Xóa phần tử khỏi danh sách nối đơn: 

Đe xóa nút p khỏi danh sách nối đon, gọi next là nút đứng liền sau p trong danh 
sách. Xét hai trường hợp: 

• Neu p là nút đầu tiên trong danh sách head — p thì ta đặt lại head bằng 
next. 
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• Neu p không phải nút đầu tiên trong danh sách, tìm nút q là nút đứng liền 
trước nút p và chỉnh lại liên kết: q liên kết tới next thay vì liên kết tới p 
(h.1.3) 

Việc cuối cùng là huỷ nút p. 

procedure Delete(p: PNode) ; //Thủ tục xóa nút p của danh sách nối đơn 
var next, q: PNode; 

begin 

next := p^.link; 

if p = head then head := next 

else 

begin 

q := head; 

while q^.link <> p do q := q^.link; 
q^.link := next; 

end; 

Dispose (p); 

end; 

head q p next 


b \ầ> 


head 


Ịầ^rnâ) 


next 


Hình 1.3. Xóa phần tử khỏi danh sách nối đơn 

Cũng giống như phép chèn, phép xóa một phần tử khỏi danh sách nối đơn cũng 
mất thời gian trưng bình 0(n) đế thực hiện. 

Trên đây mô tả các thao tác với danh sách biếu diễn dưới dạng danh sách nối 
đơn các biến động. Chúng ta có thể cài đặt danh sách nối đơn bằng một mảng, 
mồi nút chứa trong một phần tử của mảng và trường liên kết link chính là chỉ số 
của nút kế tiếp. Khi đó mọi thao tác chèn/xóa phần tử cũng được thực hiện 
tương tự như trên: 

const max = . . . ; //số phần tử cực đại 

type 

TNode = record 
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inf o 

: TElement; 

link 

: Integer; 

end; 


TList 

= array[1..max] of TNode; 

var 


Nodes: 

TList; 

head: 

Integer; 


1.4. Biểu diễn danh sách bằng danh sách nối kép 

Việc xác định nút đứng liền trước một nút p trong danh sách nối đơn bắt buộc 
phải duyệt từ đầu danh sách, thao tác này mất thời gian trung bình 0(n) đế thực 
hiện và ảnh hưởng trực tiếp tới thời gian thực hiện thao tác chèn/xóa phần tử. Đe 
khắc phục nhược điếm này, người ta sử dụng danh sách nối kép. 

Danh sách nối kép gồtn các nút được nối với nhau theo hai chiều. Mồi nút là 
một bản ghi (record) gồm ba trường: 






Trường ỉnfo chứa giá trị lưu trong nút đó. 

Trường next chứa liên kết (con trỏ) tới nút kế tiếp, tức là chứa một thông 
tin đủ đế biết nút kế tiếp nút đó là nút nào, trong trường hợp nút đứng cuối 
cùng trong danh sách (không có nút kế tiếp), trường liên kết này được gán 
một giá trị đặc biệt (chẳng hạn con trỏ nil ) 

Trường prev chứa liên kết (con trỏ) tới nút liền trước, tức là chứa một 
thông tin đủ để biết nút liền trước nút đó là nút nào, trong trường hợp nút 
đứng đầu tiên trong danh sách (không có nút liền , — ~ C\ 

pre V ( GT“ info — 

trước), trường liên kêt này được gán một giá trị '•V —-— 
đặc biệt (chẳng hạn con trỏ nil) 


next 


type 


PNode = 

A TNo de; //Kiến con trỏ tói một nút 

TNode = 

record; //Kiếu biến động chứa thông tin trong một nút 

inf o: 

TElement; 

next, 

prev: PNode; 

end; 



Khác với danh sách nối đơn, trong danh sách nối kép ta quan tâm tới hai nút: 
Nút đầu tiên ựirst) và phần tử cuối cùng ( last ). Có hai cách duyệt danh sách 
nối kép: Hoặc bắt đầu từ first, dựa vào liên kết next đế đi sang nút kế tiếp, đến 


11 






khi gặp giá trị đặc biệt (duyệt qua last ) thì dừng lại. Hoặc bắt đầu từ last, dựa 
vào liên kết prev đế đi sang nút liền truớc, đến khi gặp giá trị đặc biệt (duyệt 
qua first ) thì dừng lại 



Hình 1.4. Danh sách nối kép 

Giống nhu danh sách nối đơn, việc chèn/xóa nút trong danh sách nối kép cũng 
đơn giản chỉ là kỹ thuật chỉnh lại các mối liên kết giữa các nút cho hợp lý. Tuy 
nhiên ta có thể xác định đuợc dễ dàng nút đứng liền truớc/liền sau của một nút 
trong thời gian 0(1), nên các thao tác chèn/xóa trên danh sách nối kép chỉ mất 
thời gian 0(1), tốt hơn so với cài đặt bằng mảng hay danh sách nối đơn. 

1.5. Biểu diễn danh sách bằng danh sách nối vòng đơn 

Trong danh sách nối đon, phần tử cuối cùng trong danh sách có truờng liên kết 
đuợc gán một giá trị đặc biệt (thuờng sử dụng nhất là giá trị nil). Neu ta cho 
truờng liên kết của phần tử cuối cùng trỏ thắng về phần tử đầu tiên của danh 
sách thì ta sẽ đuợc một kiểu danh sách mới gọi là danh sách nối vòng đơn. 



Hình 1.5. Danh sách nối vòng đơn 

Đối với danh sách nối vòng đơn, ta chỉ cần biết một nút bất kỳ của danh sách là 
ta có thế duyệt đuợc hết các nút trong danh sách bằng cách đi theo huớng liên 
kết. Chính vì lý do này, khi chèn/xóa vào danh sách nối vòng đơn, ta không phải 
xử lý các truờng hợp riêng khi nút đứng đầu danh sách. Mặc dù vậy, danh sách 
nối vòng đơn vẫn cần thời gian trung bình 0(n) đế thực hiện thao tác chèn/xóa 
vì việc xác định nút đứng liền truớc một nút cho truớc cũng gặp trở ngại như với 
danh sách nối đơn. 


12 



























1.6. Biểu diễn danh sách bằng danh sách nối vòng kép 

Danh sách nối vòng đơn chỉ cho ta duyệt các nút của danh sách theo một chiều, 
nếu cài đặt bằng danh sách nối vòng kép thì ta có thế duyệt các nút của danh 
sách cả theo chiều nguợc lại nữa. Danh sách nối vòng kép có thể tạo thành từ 
danh sách nối kép nếu ta cho trường prev của nút first trỏ tới nút Last còn 
trường next của nút last thì trỏ tới nút first. 

Tương tự như danh sách nối kép, danh sách nối vòng kép cho phép thao tác 
chèn/xóa phần tử có thế thực hiện trong thời gian 0(1). 



1.7. Biếu diễn danh sách bằng cây 

Có nhiều thao tác trên danh sách, nhưng những thao tác phổ biến nhất là truy 
cập phần tử, chèn và xóa phần tử. Ta đã khảo sát cách cài đặt danh sách bằng 
mảng hoặc danh sách liên kết, nếu như mảng cho phép thao tác truy cập ngẫu 
nhiên tốt hơn danh sách liên kết, thì thao tác chèn/xóa phần tử trên mảng lại mất 
khá nhiều thời gian. 

Dưới đây là bảng so sánh thời gian thực hiện các thao tác trên danh sách. 


Phương pháp 

Truy cập ngẫu nhiên 

Chèn 

Xóa 

Mảng 

0(1) 

0(n) 

0(n) 

Danh sách nối đơn 

0(n) 

0(n) 

0(n) 

Danh sách nối kép 

0(n) 

0(1) 

0(1) 

Danh sách nối vòng đơn 

0(1) 

0(n) 

0(n) 

Danh sách nối vòng kép 

0(n) 

0(1) 

0(1) 


Cây là một kiểu dữ liệu trừu tượng mà trong một số trường hợp có thể gián tiếp 
dùng để biếu diễn danh sách. Với một cách đánh số thứ tự cho các nút của cây 
(duyệt theo thứ tự giữa), mỗi phép truy cập ngẫu nhiên, chèn, xóa phần tử trên 
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danh sách có thể thực hiện trong thời gian O(logn). Chúng ta sẽ tiếp tục chủ đề 
này trong một bài riêng. 


Bài tập 

1 . 1 . Viết chưong trình thực hiện các phép chèn, xóa, và tìm kiếm một phần tử 
trong danh sách các số nguyên đã sắp xếp theo thứ tự tăng dần biểu diễn 
bởi: 

• Mảng 

• Danh sách nối đon 

• Danh sách nối kép 

1 . 2 . Viết chuông trình nối hai danh sách số nguyên đã sắp xếp, tổng quát hon, 
viết chuông trình nối k danh sách số nguyên đã sắp xếp để đuợc một danh 
sách gồm tất cả các phần tử. 

1 . 3 . Giả sử chúng ta biểu diễn một đa thức p(x) = a 1 x bl + a 2 x b2 + —h 
a n x bn , trong âò b 1 > b 2 > •■■ > b n duới dạng một danh sách nối đon mà 
nút thứ i của danh sách chứa hệ số ãị, số mũ ỏi và con trỏ tới nút kế tiếp 
(nút i + 1). Hãy tìm thuật toán cộng và nhân hai đa thức theo các biểu diễn 
này. 

1 . 4 . Một số nhị phân a n a n _ 1 ... a 0 , trong đó ãị G {0,1} có giá trị bằng 

a Ể 2 Ể . Nguời ta biếu diễn số nhị phân này bằng một danh sách nối đon 
gồm n nút, có nút đầu danh sách chứa giá trị a n , mỗi nút trong danh sách 
chứa một chữ số nhị phân dị và con trỏ tới nút kế tiếp là nút chứa chữ số 
nhị phân aị- 1 . Hãy lập chuông trình thực hiện phép toán “cộng 1” trên số 
nhị phân đã cho và đua ra biếu diễn nhị phân của kết quả. 

Gợi ỷ: Sử dụng phép đệ quy 

2. Ngăn xếp và hàng đợi 

Ngăn xếp và hàng đợi là hai kiểu dữ liệu trừu tượng rất quan trọng và được sử 

dụng nhiều trong thiết kế thuật toán, về bản chất, ngăn xếp và hàng đợi là danh 

sách tức là một tập hợp các phần tử cùng kiểu có tính thứ tự. 
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Trong phần này chúng ta sẽ tìm hiếu hoạt động của ngăn xếp và hàng đợi và 
cách cài đặt chúng bằng các cấu trúc dữ liệu. Tuông tự nhu danh sách, ta gọi 
kiểu dữ liệu của các phần tử sẽ chứa trong ngăn xếp và hàng đợi là TElement. 
Khi cài đặt chuông trình cụ thể, kiểu TElement có thế là kiểu số nguyên, số 
thực, ký tự, hay bất kỳ kiếu dữ liệu nào đuợc chuông trình dịch chấp nhận. 

2.1. Ngăn xếp 

Ngăn xếp ( Stack ) là một kiểu danh sách mà việc bố sung một phần tử và loại bỏ 
một phần tử đuợc thực hiện ở cuối danh sách. 

Có thế hình dung ngăn xếp nhu một chồng đĩa, đĩa nào đuợc đặt vào chồng sau 
cùng sẽ nằm trên tất cả các đĩa khác và sẽ đuợc lấy ra đầu tiên. Vì nguyên tắc 
“vào sau ra truớc”, ngăn xếp còn có tên gọi là danh sách kiểu LIFO (Last In 
Eirst Out). Vị trí cuối danh sách đuợc gọi là đỉnh ( top) của ngăn xếp. 

Đối với ngăn xếp có sáu thao tác co bản: 

• Init: Khởi tạo một ngăn xếp rồng 

• IsEmpty: Cho biến ngăn xếp có rồng không? 

• IsFull: Cho biết ngăn xếp có đầy không? 

• Get: Đọc giá trị phần tử ở đỉnh ngăn xếp 

• Push: Đẩy một phần tử vào ngăn xếp 

• Pop: Lấy ra một phần tử từ ngăn xếp 

a) Biểu diễn ngăn xếp bằng mảng 

Cách biếu diễn ngăn xếp bằng mảng cần có một mảng Items để luu các phần tử 
trong ngăn xếp và một biến nguyên top đế luu chỉ số của phần tử tại đỉnh ngăn 
xếp. Ví dụ: 


const max 

= . . . ; //Dung lượng cực đại của ngăn xếp 

type 


TStack 

= record 

items 

: array[1..max] of TElement; 

top: 

Integer; 

end; 


var stack 

: TStack; 


Sáu thao tác co bản của ngăn xếp có thể viết nhu sau: 
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//Khởi tạo ngăn xếp rỗng 

procedure Init; 
begin 

stack.top := 0; 

end; 

//Hàm kiếm tra ngăn xếp có rỗng không? 
function IsEmptỵ: Boolean; 

begin 

Result := stack.top = 0; 

end; 

//Hàm kiếm tra ngăn xếp có đầy không? 
function IsFull: Boolean; 

begin 

Result := stack.top = max; 

end; 

//Đọc giá trị phần tử ở đính ngăn xếp 
function Get: TElement; 

begin 

if IsEmptỵ then 

Error <— "Stack is Emp ty" //Báo lỗi ngăn xếp rỗng 

else 

with stack do Result := items[top]; 

//Trả về phần tử ở đĩnh ngăn xếp 

end; 

//Đấy một phần tử X vào ngăn xếp 

procedure Push(const x: TElement); 

begin 

if IsFull then 

Error <— "Stack is Full" //Báo lỗi ngăn xếp đầy 

else 

with stack do 
begin 

top := top + 1; //Tăng chỉ số đỉnh Stack 
items [top] := x; //Đặt X vào vị trí đỉnh Stack 

end; 

end; 

//Lấy một phần tử ra khỏi ngăn xếp 
íunction Pop: TElement; 

begin 
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if IsEmpty then 

Error <— "Stack is Emptỵ" //Báo lỗi ngăn xếp rỗng 

else 

with stack do 
begin 

Result := ítems[top] ; //Trả về phần tữ ỏ'đỉnh ngăn xếp 
top := top - 1; //Giảm chỉ số đỉnh ngăn xếp 

end; 

end; 

b) Biểu diễn ngăn xếp bằng danh sách nối đơn kiểu LIFO 

Ta sẽ trình bày cách cài đặt ngăn xếp bằng danh sách nối đơn các biến động và 
con trỏ. Trong cách cài đặt này, ngăn xếp sẽ bị đầy nếu như vùng không gian 
nhớ dùng cho các biến động không còn đủ đế thêm một phần tử mới. Tuy nhiên, 
việc kiểm tra điều này phụ thuộc vào máy tính, chương trình dịch và ngôn ngữ 
lập trình. Mặt khác, không gian bộ nhó' dùng cho các biến động thường rất lớn 
nên ta sẽ không viết mã cho hàm IsFull : Kiểm tra ngăn xếp tràn. 

Các khai báo dữ liệu: 


type 


PNode = 

/x TNode ; //Kiếu con trò liên kết giữa các nút 

TNode = 

record //Kiểu dữ liệu cho một nút 

inf o: 

TElement; 

link: 

PNode; 

end; 


var top: 

PNode ; //Con trỏ tới phần tử đỉnh ngăn xếp 


Các thao tác trên ngăn xếp: 


//Khởi tạo ngăn 

xếp rỗng 


procedure 

Init; 


begin 



top : = 

nil; 


end; 



//Kiêm tra ngăn 

xếp có rỗng không 

function 

IsEmpty: 

Boolean; 

begin 



Result 

:= top = 

nil; 

end; 
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//Đọc giá trị phần tử ở đỉnh ngăn xếp 
function Get: TElement; 

begin 

if IsEmpty then 

Error <— "Stack is Empty" //Báo lỗi ngăn xếp rỗng 

else 

Result := top A .info; 

end; 

//Đấy một phần tửx vào ngăn xếp 

procedure Push(const x: TElement); 
var p: PNode; 

begin 

New (p) ; //Tạo nút mới 
p A .info := x; 

p x ' . 1 i nk := top; //Nối vào danh sách liên kết 
top : = p ; //Dịch con trỏ đỉnh ngăn xếp 

end; 

//Lấy một phần tử khỏi ngăn xếp 

function Pop: TElement; 
var p: PNode; 

begin 

if IsEmpty then 

Error <— "Stack is Empty" //Báo lỗi ngăn xếp rỗng 

else 

begin 

Result : = t op A . i n f o ; //Lấy phần tử tại con trỏ top 
p := top A .link; 

Dispose (top) ; //Giải phóng bộ nhớ 
top : = p; //Dịch con trỏ đỉnh ngăn xếp 

end; 

end; 

2.2. Hàng đợi 

Hàng đợi ( Queue ) là một kiểu danh sách mà việc bố sung một phần tử đuợc thực 
hiện ở cuối danh sách và việc loại bỏ một phần tử đuợc thực hiện ở đầu danh 
sách. 
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Khi cài đặt hàng đợi, có hai vị trí quan trọng là vị trí đầu danh sách ựront), nơi 
các phần tử đuợc lấy ra, và vị trí cuối danh sách (rear), nơi phần tử cuối cùng 
đuợc đua vào. 

Có thể hình dung hàng đợi nhu một đoàn nguời xếp hàng mua vé: Nguời nào 
xếp hàng truớc sẽ đuợc mua vé truớc. Vì nguyên tắc “vào truớc ra truớc”, hàng 
đợi còn có tên gọi là danh sách kiểu FIFO (First In Fỉrst Out). 

Tuơng tự nhu ngăn xếp, có sáu thao tác cơ bản trên hàng đợi: 

• Init: Khởi tạo một hàng đợi rồng 

• IsEmpty: Cho biến hàng đợi có rỗng không? 

• IsFull: Cho biết hàng đợi có đầy không? 

• Get: Đọc giá trị phần tử ở đầu hàng đợi 

• Push: Đẩy một phần tử vào hàng đợi 

• Pop: Lấy ra một phần tử từ hàng đợi 

a) Biểu diễn hàng đợi bằng mảng 

Ta có thế biếu diễn hàng đợi bằng một mảng items đế lưu các phần tử trong 
hàng đợi, một biến nguy êĩront để lưu chỉ số phần tử đầu hàng đợi và một biến 
nguyên rear đế lưu chỉ số phần tử cuối hàng đợi. Chỉ một phần của mảng items 
từ vị trí front tới rear được sử dụng lưu trữ các phần tử trong hàng đợi. Ví dụ: 


const max 

= . . . ; //Dung lượng cực đại 

type 


TQueue = 

record 

items: 

array [1..max] of TElement; 

front, 

rear: Integer; 

end; 


var Queue: 

TQueue; 


Sáu thao tác cơ bản trên hàng đợi có thể viết như sau: 

//Khởi tạo hàng đợi rỗng 

procedure Init; 
begin 

Queue.front := 1; 

Queue.rear := 0; 

end; 

//Kiêm tra hàng đợi có rông không 
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function IsEmpty: Boolean; 

begin 

Result := Queue.front > Queue.rear; 

end; 

//Kiếm tra hàng đợi có đầy không 
function IsFull: Boolean; 

begin 

Result := Queue.rear = max; 

end; 

//Đọc giá trị phần tử đầu hàng đợi 
function Get: TElement; 

begin 

if IsEmptỵ then 

Error <— "Queue is Empty" //Báo lỗi hàng đợi rỗng 

else 

with Queue do Result := items[front]; 

end; 

//Đấy một phần tửx vào hàng đợi 

procedure Push(const x: TElement); 

begin 

if IsFull then 

Error <— "Queue is Full" //Báo lỗi hàng đợi đầy 

else 

with Queue do 
begin 

rear := rear + 1; 
items[rear] := x; 

end; 

end; 

//Lấy một phần tử khỏi hàng đợi 
íunction Pop: TElement; 

begin 

if IsEmptỵ then 

Error <— "Queue is Empty" //Báo lỗi hàng đợi rỗng 

else 

with Queue do 
begin 

Result := items[front]; 
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front := front + 1; 

end; 

end; 

b) Biểu diễn hàng đợi bằng danh sách vòng 

Xét việc biếu diễn ngăn xếp và hàng đợi bằng mảng, giả sử mảng có tối đa 10 
phần tử, ta thấy rằng nếu nhu làm 6 lần thao tác Push, rồi 4 lần thao tác Pop, rồi 
tiếp tục 8 lần thao tác Push nữa thì không có vấn đề gì xảy ra cả. Lý do là vì chỉ 
số top luu đỉnh của ngăn xếp sê đuợc tăng lên 6000, rồi giảm về 2000, sau đó 
lại tăng trở lại lên 10000 (chua vuợt quá chỉ số mảng). Nhung nếu ta thực hiện 
các thao tác đó đối với cách cài đặt hàng đợi nhu trên thì sẽ gặp thông báo lỗi 
tràn mảng, bởi mỗi lần đẩy phần tử vào ngăn xếp, chỉ số cuối hàng đợi rear 
luôn tăng lên và không bao giờ bị giảm đi cả. Đó chính là nhuợc điếm mà ta nói 
tới khi cài đặt: Chỉ có các phần tử từ vị trí front tới rear là thuộc hàng đợi, các 
phần tử từ vị trí 1 tới front — 1 là vô nghĩa. 

Đế khắc phục điều này, ta có thế biểu diễn hàng đợi bằng một danh sách vòng 
(dùng mảng hoặc danh sách nối vòng đon): coi nhu các phần tử của hàng đợi 
đuợc xếp quanh vòng tròn theo một chiều nào đó (chang hạn chiều kim đồng 
hồ). Các phần tử nằm trên phần cung tròn từ vị trí front tới vị trí rear là các 
phần tử của hàng đợi. Có thêm một biến n lưu số phần tử trong hàng đợi. Việc 
đẩy thêm một phần tử vào hàng đợi tưong đưong với việc ta dịch chỉ số fear 
theo chiều vòng một vị trí rồi đặt giá trị mới vào đó. Việc lấy ra một phần tử 
trong hàng đợi tưong đưong với việc lấy ra phần tử tại vị trí front rồi dịch chỉ 
số front theo chiều vòng, (h.1.7) 
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Hình 1.7. Dùng danh sách vòng mô tả hàng đợi 

Đe tiện cho việc dịch chỉ số theo vòng, khi cài đặt danh sách vòng bằng mảng, 
người ta thường dùng cách đánh chỉ số từ 0 đế tiện sử dụng phép chia lấy dư 
(modulus - mod). 


const max 

= ... ỉ //Dung lượng cực đại 

type 



TQueue = 

record 


items: 

array[0. 

.max - 1] of TElement; 

n, front, rear: 

Integer; 

end; 



var Queue: 

TQueue; 



Sáu thao tác CO' bản trên hàng đợi cài đặt trên danh sách vòng được viết dưới 
dạng giả mã như sau: 

//Khởi tạo hàng đợi rỗng 

procedure Init; 
begin 

with Queue do 
begin 

front := 0; 
rear := max - 1; 
n : = 0 ; 

end; 

end; 

//Kiêm tra hàng đợi có rông không 

function IsEmpty: Boolean; 
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begin 

Result := Queue.n = 0; 

end; 

//Kiếm tra hàng đợi có đầy không 
function IsFull: Boolean; 

begin 

Result := Queue.n = max; 

end; 

//Đọc giá trị phần tử đầu hàng đợi 
function Get: TElement; 

begin 

if IsEmptỵ then 

Error <— "Queue is Empty" //Báo lỗi hàng đợi rỗng 

else 

with Queue do Result := items[front]; 

end; 

//Đấy một phần tử vào hàng đợi 

procedure Push(const x: TElement); 

begin 

if IsFull then 

Error <— "Queue is Full" //Báo lỗi hàng đợi đầy 

else 

with Queue do 
begin 

rear := (rear + 1) mod max; 
items[rear] := x; 

Inc (n); 

end; 

end; 

//Lấy một phần tử ra khỏi hàng đợi 
íunction Pop: TElement; 

begin 

if IsEmptỵ then 

Error <— "Queue is Empty" //Báo lỗi hàng đợi rỗng 

else 

with Queue do 
begin 

Result := items[front]; 
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front := (front + 1) mod max; 

Dec (n); 

end; 

end; 

c) Biểu diễn hàng đợi bằng danh sách nối đơn kiểu FIFO 

Tương tự như cài đặt ngăn xếp bằng biến động và con trỏ trong một danh sách 
nối đơn, ta cũng không viết hàm IsFull đế kiếm tra hàng đợi đầy. 

Các khai báo dữ liệu: 

type 

PNode = x 'TNode; //Kiểu con trỏ liên kết giữa các nút 
TNo de = record //Kiểu dữ liệu cho một nút 
info: TElement; 
link: PNode; 

end; 

var f ront, rear: PNode; //Con trỏ tới phần tử đầu và cuối hàng đợi 

Các thao tác trên hàng đợi: 

//Khởi tạo hàng đợi rỗng 

procedure Init; 
begin 

front := nil; 

end; 

//Kiếm tra hàng đợi có rỗng không 
function IsEmptỵ: Boolean; 

begin 

Result := front = nil; 

end; 

//Đọc giá trị phần tử đầu hàng đợi 
function Get: TElement; 

begin 

if IsEmpty then 

Error <— "Queue is Empty" //Báo lỗi hàng đợi rỗng 

else 

Result := front^.info; 

end; 

//Đấy một phần tữx vào hàng đợi 

procedure Push(const x: TElement); 
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var p: PNode; 

begin 

New ( p ) ; //Tạo một nút mới 
p A .info := x; 
p A .link := nil; 

//Nối nút đó vào danh sách 
if front = nil then front := p 
else rear A .link := p; 
rear := p; //Dịch con trỏ rear 
end; 

//Lấy một phần tử ra khỏi hàng đợi 

function Pop: TElement; 
var P: PNode; 

begin 

if IsEmptỵ then 

Error <— "Queue is Emptỵ" //Báo lỗi hàng đợi rỗng 

else 

begin 

Result := f r o n t A . i n f o ; //Lấy phần tử tại con trỏ front 
p := front A .link; 

Dispose (f ront) ; //Giải phóng bộ nhớ 
f ront : = p; //Dịch con trỏfront 

end; 

end; 

2.3. Một số chủ ỷ về kỹ thuật cài đặt 

Ngăn xếp và hàng đợi là hai kiểu dữ liệu trừu tuợng tuơng đối dề cài đặt, các thủ 
tục và hàm mô phỏng các thao tác có thể viết rất ngắn. Tuy vậy trong các 
chuông trình dài, các thao tác vẫn nên đuợc tách biệt ra thành chuông trình con 
để dề dàng gỡ rối hoặc thay đối cách cài đặt (ví dụ đối từ cài đặt bằng mảng 
sang cài đặt bằng danh sách nối đon). Điều này còn giúp ích cho lập trình viên 
trong truờng hợp muốn biểu diễn các kiếu dữ liệu trừu tuợng bằng các lớp và 
đối tuợng. Neu có băn khoăn rằng việc gọi thực hiện chuông trình con sẽ làm 
chuông trình chạy chậm hon việc viết trực tiếp, bạn có thể đặt các thao tác đó 
duới dạng inline íunctions. 
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Bài tập 

1.5. Hàng đợi hai đầu ( doubled-ended queue) là một danh sách được trang bị 
bốn thao tác: 

PushF(y ): Đẩy phần tử V vào đầu danh sách 
PushRiy ): Đẩy phần tử V vào cuối danh sách 
PopF: Loại bỏ phần tử đầu danh sách 
PopR : Loại bỏ phần tử cuối danh sách 

Hãy tìm cấu trúc dữ liệu thích hợp đế cài đặt kiếu dữ liệu trừu tượng hàng 
đợi hai đầu. 

1.6. Có hai so đồ đường ray xe lửa bố trí như hình sau: 

3 _2_Ị_ 

♦"♦nvvr !♦ ♦! 



Ban đầu có n toa tàu xếp theo thứ tự từ 1 tới n từ phải qua trái trên đường 
ray A. Người ta muốn xếp lại các toa tàu theo thứ tự mới từ phải qua trái 
(p 1 ,p 2 ,...., Pn) lên đường ray c theo nguyên tắc: Các toa tàu không được 
“vượt nhau” trên ray, mỗi lần chỉ được chuyển một toa tàu từ Ấ -» 5, 
A -» B hoặc A -> c. Hãy cho biết điều đó có thế thực hiện được trên SO' đồ 
đường ray nào trong hai SO' đồ trên. 
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3. Cây 

3.1. Định nghĩa 

Cây là một kiểu dữ liệu trừu tuợng gồm một tập hữu hạn các nút, giữa các nút có 

một quan hệ phân cấp gọi là quan hệ “cha-con”. Có một nút đặc biệt gọi là gốc 

(root). 

Có thế định nghĩa cây bằng cách đệ quy nhu sau: 

• Một nút là một cây, nút đó cũng là gốc của cây ấy 

• Neu r là một nút và r lt r 2 ,..., r k lần luợt là gốc của các cây 7\, T 2 ,..., T k , thì 
ta có thể xây dựng một cây mới T bằng cách cho nút r trở thảnh cha của các 
nút r 1 ,r 2 , ...,r k . Cây T này nút gốc là r còn các cây r x ,T 2 , —,T k trở thành 
các cây con hay nhánh con (subtree) của nút gốc. 

Đe tiện, nguời ta còn cho phép tồn tại một cây không có nút nào mà ta gọi là cây 

rỗng (null tree), ký hiệu A. 

Một vài hình ảnh của cấu trúc cây: 

• Mục lục của một cuốn sách với phần, chuông, bài, mục v.v... có cấu trúc 
của cây 

• Cấu trúc thu mục trên đĩa cũng có cấu trúc cây, thu mục gốc có thế coi là 
gốc của cây đó với các cây con là các thu mục con (sub-directories) và tệp 
(íĩles) nằm trên thu mục gốc. 

• Gia phả của một họ tộc cũng có cấu trúc cây. 

• Một biểu thức số học gồm các phép toán cộng, trừ, nhân, chia cũng có thể 
lưu trữ trong một cây mà các toán hạng được lưu trữ ở các nút lá, các toán 
tử được lưu trữ ở các nút nhánh, mỗi nhánh là một biểu thức con (h. 1.8). 
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Hình 1.8. Cây biếu diễn biếu thức 


3.2. Các khái niệm cơ bản 

Nếu (r 1( r 2 , ...,r fc ) là dãy các nút trên cây sao cho Vị là nút cha của nút r i+1 với 
Vi: 1 < i < k, thì dãy này được gọi là một đường đi (path ) từ r x tới r k . Chiều dài 
của đường đi bằng số nút trên đường đi trừ đi 1. Quy ước rằng có đường đi độ 
dài 0 từ một nút đến chính nó. Như cây ở hình 1.9, ( A, B, F) là đường đi độ dài 
2, (Ạ D, H, K ) là đường đi độ dài 3. 



Neu có một đường đi độ dài khác 0 từ nút a tới nút d thì nút a gọi là tiền bối 
(ancestor) của nút d và nút d được gọi là hậu duệ (descendant) của nút a. Như 
cây ở hình 1.9, nút A là tiền bối của tất cả các nút trên cây, nút H là hậu duệ của 
nút A và nút D. Một số quy ước còn cho phép một nút là tiền bối cũng như hậu 
duệ của chính nút đó, trong trường hợp này, người ta có thêm khái niệm tiền bổi 
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thực sự iproper ancestor ) và hậu duệ đích thực iproper descendant) trùng với 
khái niệm tiền bối và hậu duệ mà ta đã định nghĩa. 

Trong cây, chỉ duy nhất một nút không có tiền bối là nút gốc. Một nút không có 
hậu duệ gọi là nút lả ựeaf) của cây, các nút không phải lá đuợc gọi là nút nhánh 
(branch). Nhu cây ở hình 1.9, các nút c, E, F, G, I,J, K là các nút lá. 

Độ cao của một nút là độ dài đuờng đi dài nhất từ nút đó tới một nút lá hậu duệ 
của nó, độ cao của nút gốc gọi là chiều cao (height) của cây. Nhu cây ở hình 1.9, 
cây có chiều cao là 3 (đuờng đi ( A, D, H,J )). 

Độ sâu (depth ) của một nút là độ dài đuờng đi duy nhất từ nút gốc tới nút đó. 
Nhu cây ở hình 1.9, nút A có độ sâu là 0, nút B,C,D có độ sâu là 1, nút 
E,F,G,H,I có độ sâu là 2, và nút ],K có độ sâu là 3. Có thể định nghĩa chiều 
cao của cây là độ sâu lớn nhất của các nút trong cây. 

Một tập hợp các cây đôi một không có nút chung đuợc gọi là rừng ựorest), có 
thế coi tập các cây con của một nút là một rừng. 

Những nút con của cùng một nút đuợc gọi là anh em (sibling ). Với một cây, nếu 
chúng ta có tính đến thứ tự anh em thì cây đó gọi là cây có thứ tự (ordered tree ), 
còn nếu chúng ta không quan tâm tới thứ tự anh em thì cây đó gọi là cây không 
có thứ tự (unordered tree). 

3.3. Biểu diễn cây tổng quát 

Trong thực tế, có một số ứng dụng đòi hỏi một cấu trúc dữ liệu dạng cây nhung 
không có ràng buộc gì về số con của một nút trên cây, ví dụ nhu cấu trúc thu 
mục trên đĩa hay hệ thống đề mục của một cuốn sách. Khi đó, ta phải tìm cách 
mô tả một cách khoa học cấu trúc dữ liệu dạng cây tống quát. Giả sử TElement 
là kiếu dữ liệu của các phần tử chứa trong mỗi nút của cây, khi đó ta có thể biếu 
diễn cây bằng một trong các cấu trúc dữ liệu sau: 

a) Biểu diễn bằng liên kết tới nút cha 

Với T là một cây, trong đó các nút đuợc đánh số từ 1 tới 71, khi đó ta có thế gán 
cho mỗi nút i một nhãn parentịi ] là số hiệu nút cha của nút i. Neu nút i là nút 
gốc, thì parentịi ] đuợc gán giá trị 0. Cách biếu diễn này có thể cài đặt bằng một 
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mảng các nút, mồi nút là một bản ghi bên trong chứa giá trị lưu tại nút (in/o) và 
nhãn parent. 

const max = ... ỉ //Dung lượng cực đại 

type 

TNode = record 
info: TElement; 
parent: Integer; 

end; 

TTree = array [1..max] of TNode; 

var Tree: TTree; 

Trong cách biếu diễn này, nếu chúng ta cần biết nút cha của một nút thì chỉ cần 
truy xuất trường parent của nút đó. Tuy nhiên nếu ta cần liệt kê tất cả các nút 
con của một nút thì không có cách nào khác là phải duyệt toàn bộ danh sách nút 
và kiếm tra trường parent. Thực hiện việc này mất thời gian 0(n) với mồi nút. 

b) Biểu diễn bằng cấu trúc liên kết 

Trong cách biểu diễn này, ta sắp xếp các nút con của mồi nút theo một thứ tự 
nào đó. Mồi nút của cây là một bản ghi gồm 4 trường: 

• Trường info: Chứa giá trị lưu trong nút 

• Trường parent : Chứa con trỏ liên kết tới nút cha, tức là chứa một thông tin 
đủ đế biết nút cha của nút đang xét là nút nào. Trong trường hợp nút đang 
xét là gốc (không có nút cha), trường parent được gán một giá trị đặc biệt 
(nil). 

• Trường first: Chứa liên kết (con trỏ) tới nút con đầu tiên (con cả) của nút 
đang xét, trong trường hợp nút đang xét là nút lá (không có nút con), trường 
này được gán một giá trị đặc biệt ( nil ). 

• Trường sibling : Chứa liên kết (con trỏ) tới nút em kế cận (nút cùng cha với 
nút đang xét, khi sắp thứ tự các nút con thì nút sibling đứng liền sau nút 
đang xét). Trong trường hợp nút đang xét không có nút em, trường này 
được gán một giá trị đặc biệt ( nil ). 

type 

PNode = A TNode; 

TNode = record 
info: TElement; 
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Hình 1.10. Cấu trúc nút của cây tống quát 

Trong các biểu diễn này, từ một nút r bất kỳ, ta có thể đi theo liên kết first để 
đến nút con đầu tiên, nút này chính là chốt của một danh sách nối đon các nút 
con: Từ nút first, đi theo liên kết sibling, ta có thể duyệt tất cả các nút con của 
nút r. 

Trong truờng hợp phải thực hiện nhiều lần phép chèn/xóa một cây con, nguời ta 
có thể biếu diễn danh sách các nút con của một nút duới dạng danh sách móc nối 
kép để việc chèn/xóa đuợc thực hiện hiệu quả hon, khi đó thay vì truờng liên kết 
đon sibling, mỗi nút sẽ có hai truờng prev và next chứa liên kết tới nút anh 
liền truớc và em liền sau của một nút. 


3.4. Cây nhị phân 

Cây nhị phân (bỉnary tree) là một dạng quan trọng của cấu trúc cây. Nó có đặc 
điểm là mọi nút trên cây chỉ có tối đa hai nhánh con. Với một nút thì nguời ta 
cũng phân biệt cây con trái và cây con phải của nút đó, tức là cây nhị phân là 
cây có thứ tự. 
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a) Một số dạng đặc biệt của cây nhị phân 




Hình 1.11. Cây nhị phân suy biến 

Các cây nhị phân trong hình 1.11 được gọi là cây nhị phân suy hiến (degenerate 
binary tree), trong cây nhị phân suy biến, các nút không phải lá chỉ có đúng một 
cây con. Cây a) được gọi là cây lệch phải, cây b) được gọi là cây lệch trái, cây c) 
và d) được gọi là cây zíc-zắc. 



Hình 1.11. Cây nhị phân hoàn chính 

Cây trong hình 1.11 được gọi là cây nhị phản hoàn chỉnh (compỉete binary tree). 
Cây nhị phân hoàn chỉnh có mọi nút lá nằm ở cùng một độ sâu và mọi nút nhánh 
đều có hai nhánh con. số nút ở độ sâu h của cây nhị phân hoàn chỉnh là 2 h . 
Tổng số nút của cây nhị phân hoàn chỉnh độ cao h là 2 h+1 — 1 
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Hình 1.12. Cây nhị phân gần hoàn chỉnh 


Cây trong hình 1.12 được gọi là cây nhị phản gần hoàn chỉnh (nearly compìete 
bỉnary treè). Một cây nhị phân độ cao h được gọi là cây nhị phân gần hoàn 
chỉnh nếu ta bỏ đi mọi nút ở độ sâu h thì được một cây nhị phân hoàn chỉnh. 
Cây nhị phân hoàn chỉnh hiển nhiên là cây nhị phân gần hoàn chỉnh. 



Hình 1.13. Cây nhị phân đầy đủ 

Cây trong hình 1.13 được gọi là cây nhị phân đầy đủ ựull bỉnary tree). Cây nhị 
phân đầy đủ là cây nhị phân mà mọi nút nhánh của nó đều có hai nút con. 

Dễ dàng chứng minh được những tính chất sau: 

• Trong các cây nhị phân có cùng số lượng nút như nhau thì cây nhị phân suy 
biến có chiều cao lớn nhất, còn cây nhị phân gần hoàn chỉnh thì có chiều 
cao nhỏ nhất. 

• Số lượng tối đa các nút ở độ sâu d của cây nhị phân là 2 d 

• Số lượng tối đa các nút trên một cây nhị phân có chiều cao h. là 2 h+1 — 1 

• Cây nhị phân gần hoàn chỉnh có n nút thì chiều cao của nó là [lg nj. 
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b) Biểu diễn cây nhị phân 

Rõ ràng có thể sử dụng các cách biểu diễn cây tổng quát để biểu diễn cây nhị 
phân, nhung dựa vào những đặc điểm riêng của cây nhị phân, chúng ta có thể có 
những cách biếu diễn hiệu quả hơn. Trong phần này chúng ta xét một số cách 
biểu diễn đặc thù cho cây nhị phân, tuơng tự nhu với đối với cây tống quát, ta 
gọi TElement là kiểu dữ liệu của các phần tử chứa trong các nút của cây nhị 
phân. 

□ Biểu diễn bằng mảng 

Một cây nhị phân hoàn chỉnh có n nút thì có chiều cao là [lgnj, tức là các nút sẽ 
nằm ở các độ sâu từ 0 tới [lgnj, Khi đó ta có thế liệt kê tất cả các nút từ độ sâu 0 
(nút gốc) tới độ sâu [lgnj, sao cho với các nút cùng độ sâu thì thứ tự liệt kê là từ 
trái qua phải. Thứ tự liệt kê cho phép ta đánh số các nút từ 1 tới n (h. 1.14). 



Hình 1.14. Đánh số các nút của cây nhị phân hoàn chỉnh đế biếu diễn bằng măng 

Với cách đánh số này, hai con của nút thứ i sẽ là các nút thứ 2i và 2i + 1. Cha 
của nút thứ i là nút thứ [i/2j. Ta có thể lưu trữ cây bằng một mảng info trong 
đó phần tử chứa trong nút thứ i của cây được lưu trữ trong mảng bởi info[i]. 
Với cây nhị phân ở hình 1.14, ta có thể dùng mảng info — ( A,B,E,C,D,E,G ) 
để chứa các giá trị trên cây. 

Trong trường hợp cây nhị phân không hoàn chỉnh, ta có thể thêm vào một số nút 
giả đế được cây nhị phân hoàn chỉnh. Khi biểu diễn bằng mảng thì những phần 
tử tương ứng với các nút giả sê được gán một giá trị đặc biệt. Chính vì lý do này 
nên việc biểu diễn cây nhị phân không hoàn chỉnh bằng mảng sẽ rất lãng phí bộ 
nhớ trong trường hợp phải thêm vào nhiều nút giả. Ví dụ ta cần tới một mảng 15 
phần tử đế lưu trữ cây nhị phân lệch phải chỉ gồm 4 nút (h. 1.15). 
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Hình 1.15. Nhược điếm của phương pháp biếu diễn cây nhị phân bằng măng 


□ Biếu diễn bằng cấu trúc liên kết. 

Khi biểu diễn cây nhị phân bằng cấu trúc liên kết, mồi nút của cây là một bản 
ghi (record) gồm 4 truờng: 


• Truờng info: Chứa giá trị luu tại nút đó 

• Truờng parent: Chứa liên kết (con trỏ) tới nút cha, tức là chứa một thông 
tin đủ đế biết nút cha của nút đó là nút nào, đối với nút gốc, truờng này 
đuợc gán một giá trị đặc biệt ( nil ). 

• Truờng left: Chứa liên kết (con trỏ) tới nút con trái, tức là chứa một thông 
tin đủ đế biết nút con trái của nút đó là nút nào, trong truờng hợp không có 
nút con trái, truờng này đuợc gán một giá trị đặc biệt ( nil ). 

• Truờng right : Chứa liên kết (con trỏ) tới nút con phải, tức là chứa một 
thông tin đủ để biết nút con phải của nút đó là nút nào, 
trong truờng hợp không có nút con phải, truờng này đuợc 
gán một giá trị đặc biệt ( nil ). 

Đối với cây ta chỉ cần phải quan tâm giữ lại nút gốc (root), 
bởi từ nút gốc, đi theo các huớng liên kết left, right ta có thế 
duyệt mọi nút khác. /e C 


parent 




info 

3 J 

15 


right 


type 


PNode = 

A TNo de; //Kiến con trỏ tói một nút 

TNode = 

record //cấu trúc biến động chứa thông tin trong một nút 

inf o: 

TElement; 

lef t, 

right: PNode 

end; 


var root: 

PNo de ; //Con trỏ tới nút gốc 
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Trong trường hợp biết rõ giới hạn về số nút của cây, ta có thế lưu trữ các nút 
trong một mảng, và dùng chỉ số mảng như liên kết tới một nút: 



Hình 1.16. Biếu diễn cây nhị phân bằng cấu trúc liên kết 

c) Phép duyệt cây nhị phân 

Phép xử lý các nút trên cây mà ta gọi chung là phép thăm ( vỉsit ) các nút một 
cách hệ thống sao cho mồi nút chỉ được thăm một lần gọi là phép duyệt cây. 

Giả sử rằng cấu trúc một nút của cây được đặc tả như sau: 

type 


36 


























PNode = 
TNode = 
inf o: 
lef t, 

end; 

var root: 


A TNode; //Kiểu con trỏ tới một nút 

record //cấu trúc biến động chứa thông tin trong một nút 

TElement; 
right: PNode 

PNode ; //Con trỏ tới nút gốc 


Quy ước rằng nếu như một nút không có nút con trái (hoặc nút con phải) thì liên 
kết left (right ) của nút đó được liên kết thắng tới một nút đặc biệt mà ta gọi là 
nil, nếu cây rồng thì nút gốc của cây đó cũng được gán bằng nil. Khi đó có ba 
cách duyệt cây hay được sử dụng: 


□ Duyệt theo thứ tự trước 

Trong phép duyệt theo thứ tự trước (preorder traversal ) thì giá trị trong mỗi nút 
bất kỳ sẽ được liệt kê trước tất cả các giá trị lưu trong hai nhánh con của nó, có 
thể mô tả bằng thủ tục đệ quy sau: 

procedure Visit(node: PNode) ; //Duyệt nhánh cây gốc node'' 

begin 

if node Ỷ nil then 
begin 

Output <— node A .info; 
visit(node A .left); 

Visit(node A .right); 

end; 

end; 

Quá trình duyệt theo thứ tự trước bắt đầu bằng lời gọi Visit(Root ). 
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Hình 1.17 là một cây nhị phân có 9 nút. Neu ta duyệt cây này theo thứ tự trước 
thì quá trình duyệt theo thứ tự trước sẽ lần lượt liệt kê các giá trị: 

F,D,B,A, c, E, H, G, I 

□ Duyệt theo thứ tự giữa 

Trong phép duyệt theo thứ tự giữa (ỉnorder traversal) thì giá trị trong mỗi nút 
bất kỳ sê được liệt kê sau tất cả các giá trị lưu ở nút con trái và được liệt kê 
trước tất cả các giá trị lưu ở nút con phải của nút đó, có thế mô tả bằng thủ tục 
đệ quy sau: 

procedure Visit(node: PNode) ; //Duyệt nhánh cây gốc node A 

begin 

if node Ỷ nil then 
begin 

Visit (node / '. left) ; 

Output <— node A .info; 

Visit(node A .right); 

end; 

end; 

Quá trình duyệt theo thứ tự giữa cũng bắt đầu bằng lời gọi Visit(Root). 

Neu ta duyệt cây ở hình 1.17 theo thứ tự giữa thì quá trình duyệt sẽ liệt kê lần 
lượt các giá trị: 

A, B, c, D, E, F, G, H, I 
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□ Duyệt theo thứ tự sau 

Trong phép duyệt theo thứ tự sau thì giá trị trong mỗi nút bất kỳ sẽ đuợc liệt kê 
sau tất cả các giá trị luu trong hai nhánh con của nó, có thế mô tả bằng thủ tục 
đệ quy sau: 

procedure Visit(node: PNode) ; //Duyệt nhánh cây gốc node A 

begln 

if node y nil then 
begin 

visit(node A .left); 
visit(node A .right); 

Output <— node A .info; 

end; 

end; 

Quá trình duyệt theo thứ tự sau cũng bắt đầu bằng lời gọi Visit(Root). 

Cũng với cây ở hình 1.17, nếu ta duyệt theo thứ tự sau thì các giá trị sẽ lần luợt 
đuợc liệt kê theo thứ tự: 

A, c, B, E, D, G, I, H, F 


3.5. Cây k-phăn 

Cây /í-phân là một dạng cấu trúc cây mà mỗi nút trên cây có tối đa k nút con (có 
tính đến thứ tự của các nút con). 

Cũng tưong tự như việc biếu diễn cây nhị phân, người ta có thế thêm vào cây k- 
phân một số nút giả đế cho mỗi nút nhánh của cây /c-phân đều có đúng k nút 
con, các nút con được xếp thứ tự từ nút con thứ nhất tới nút con thứ k, sau đó 
đánh số các nút trên cây k -phân bắt đầu từ 0 trở đi, bắt đầu từ mức 1, hết mức 
này đến mức khác và từ “trái qua phải” ở mồi mức. 

Theo cách đánh số này, nút con thứ j của nút i sẽ là: ki + j. Neu i không phải là 
nút gốc (i > 0) thì nút cha của nút i là nút [(í — l)/k\. Ta có thể dùng một mảng 
Info đánh số từ 0 để lưu các giá trị trên các nút: Giá trị tại nút thứ i được lưu trữ 
ở phần tử Info[i]. Đây là cơ chế biếu diễn cây k -phân bằng mảng. 

Cây k -phân cũng có thể biểu diễn bằng cấu trúc liên kết với cấu trúc dữ liệu cho 
mỗi nút của cây là một bản ghi (record) gồm 3 trường: 
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• Trường in/o: Chứa giá trị lưu trong nút đó. 

• Trường parent: Chứa liên kết (con trỏ) tới nút cha, tức là chứa một thông 
tin đủ đế biết nút cha của nút đó là nút nào, đối với nút gốc, trường này 
được gán một giá trị đặc biệt ( nil ). 

• Trường links: Là một mảng gồm k phần tử, phần tử thứ i chứa liên kết (con 
trỏ) tới nút con thứ i, trong trường hợp không có nút con thứ i thì linksịi] 
được gán một giá trị đặc biệt ( nil ). 

Đối với cây k- phân, ta cũng chỉ cần giữ lại nút gốc, bởi từ nút gốc, đi theo các 

hướng liên kết có thể đi tới mọi nút khác. 


Bài tập 

1 . 7 . Xét hai nút X, y trên một cây nhị phân, ta nói nút X nằm bên trái nút y (nút 
y nằm bên phải nút x) nếu: 

• Hoặc nút X nằm trong nhánh con trái của nút y 

• Hoặc nút y nằm trong nhánh con phải của nút X 

• Hoặc tồn tại một nút z sao cho X nằm trong nhánh con trái và y nằm trong 
nhánh con phải của nút z 

Chỉ ra rằng với hai nút X, y bất kỳ trên một cây nhị phân (x ^ y) chỉ có 
đúng một trong bốn mệnh đề sau là đúng: 

• X nằm bên trái y 

• X nằm bên phải y 

• X là tiền bối thực sự của y 

• y là tiền bối thực sự của X 

1 . 8 . Với mồi nút X trên cây nhị phân T, giả sử rằng ta biết được các giá trị 
Preorderịx], Inorder[x] và Postorderịx] lần lượt là thứ tự duyệt trước, 
giữa, sau của X. Tìm cách chỉ dựa vào các giá trị này để kiếm tra hai nút có 
quan hệ tiền bối-hậu duệ hay không. 

1 . 9 . Bậc (degree) của một nút là số nút con của nó. Chứng minh rằng trên cây 
nhị phân, số lá nhiều hon số nút bậc 2 đúng một nút. 
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1 . 10 . Chỉ ra rằng cấu trúc của một cây nhị phân có thế khôi phục một cách đơn 
định nếu ta biết đuợc thứ tự duyệt truớc và giữa của các nút. Tuơng tự nhu 
vậy, cấu trúc cây có thế khôi phục nếu ta biết đuợc thứ tự duyệt sau và 
giữa của các nút. 

1 . 11 . Tìm ví dụ về hai cây nhị phân khác nhau nhung có thứ tự truớc của các nút 
giống nhau và thứ tự sau của các nút cũng giống nhau trên hai cây. 

4. Ký pháp tiền tố, trung tố và hậu tố 

Đe kết thúc chuơng này, chúng ta nói tới một ứng dụng của ngăn xếp và cây nhị 
phân: Bài toán phân tích và tính giá trị biếu thức. 

4.1. Biếu thức dưới dạng cây nhị phân 

Chúng ta có thể biếu diễn các biếu thức số học gồm các phép toán cộng, trừ, 
nhân, chia bằng một cây nhị phân đầy đủ, trong đó các nút lá biếu thị các toán 
hạng (hằng, biến), các nút không phải là lá biếu thị các toán tử (phép toán số học 
chang hạn). Mỗi phép toán trong một nút sẽ tác động lên hai biếu thức con nằm 
ở cây con bên trái và cây con bên phải của nút đó. Ví dụ: Biểu thức (6/2 + 
4) X (8 — 3) đuợc biểu diễn trong cây ở hình 1.18. 



Hình 1.18. Cây biếu diễn biếu thức 

4.2. Các ký pháp cho cùng một biếu thức 
Với cây nhị phân biểu diễn biểu thức trong hình 4.1, 
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• Nếu duyệt theo thứ tự truớc, ta sẽ đuợc X +/624 — 83, đây là dạng 
tiền tổ (prẹ/ìx) của biểu thức. Trong ký pháp này, toán tử đuợc viết truớc 
hai toán hạng tuong ứng, nguời ta còn gọi ký pháp này là ký pháp Ba lan. 

• Neu duyệt theo thứ tự giữa, ta sẽ đuợc 6/2 + 4 X 8 - 3. Ký pháp này 
bị nhập nhằng vì thiếu dấu ngoặc. Neu thêm vào thủ tục duyệt một co chế 
bố sung các cặp dấu ngoặc vào mỗi biểu thức con, ta sẽ thu đuợc biểu thức 



6/2) + 4) X (8 — 3) j. Ký pháp này gọi là dạng trung tố (in/ìx) của một 


biểu thức (Thực ra chỉ cần thêm các dấu ngoặc đủ đế tránh sự mập mờ mà 
thôi, không nhất thiết phải thêm vào đầy đủ các cặp dấu ngoặc). 

• Nếu duyệt theo thứ tự sau, ta sê đuợc 62/4 + 83 — X, đây là dạng hậu 
tố (postfix) của biếu thức. Trong ký pháp này toán tử đuợc viết sau hai toán 
hạng, nguời ta còn gọi ký pháp này là kỷ pháp nghịch đảo Balan {Rever.se 
Polish Notation - RPN) 

Chỉ có dạng trung tố mới cần có dấu ngoặc, dạng tiền tố và hậu tố không cần 
phải có dấu ngoặc. Chúng ta sẽ thảo luận về tính đon định của dạng tiền tố và 
hậu tố trong phần sau. 

4.3. Cách tính giá trị biếu thức 

Có một vấn đề cần lưu ý là khi máy tính giá trị một biểu thức số học gồm các 
toán tử hai ngôi (toán tử gồm hai toán hạng như +, —,x,/) thì máy chỉ thực hiện 
được phép toán đó với hai toán hạng. Neu biểu thức phức tạp thì máy phải chia 
nhỏ và tính riêng từng biếu thức trưng gian, sau đó mới lấy giá trị tìm được đế 
tính tiếp*. Ví dụ như biểu thức 1 + 2 + 4 máy sẽ phải tính 1 + 2 trước được kết 
quả là 3 sau đó mới đem 3 cộng với 4 chứ không thế thực hiện phép cộng một 
lúc ba số được. 

Khi lưu trữ biếu thức dưới dạng cây nhị phân thì ta có thế coi mỗi nhánh con của 
cây đó biểu diễn một biếu thức trung gian mà máy cần tính trước khi tính biếu 
thức lớn. Như ví dụ trên, máy sẽ phải tính hai biểu thức 6/2 + 4 và 8 — 3 trước 


Thực ra đây là việc của trinh dịch ngôn ngữ bậc cao, còn máy chỉ tính các phép toán với hai toán hạng 
theo trinh tự của các lệnh được phân tích ra. 
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khi làm phép tính nhân cuối cùng. Đe tính biểu thức 6/2 + 4 thì máy lại phải 
tính biếu thức 6/2 truớc khi đem cộng với 4. 

Vậy để tính một biểu thức lưu trữ trong một nhánh cây nhị phân gốc r, máy sẽ 
làm giống như hàm đệ quy sau: 

function Calculate(r: Nút): Giá trị; 

//Tính biếu thức con trong nhánh cây gốc r 

begin 

if «nút r chứa một toán hạng» then 
Result := «Giá trị chứa trong nút r» 

else //Nút r chứa một toán tử ♦ 

begin 

X := Calculate (nút con trái của r) ; 
y := Calculate (nút con phải của r) ; 

Result := X ♦ y; 

end; 

end; 

(Trong trường hợp lập trình trên các hệ thống song song, việc tính giá trị biếu 
thức ở cây con trái và cây con phải có thế tiến hành đồng thời làm giảm đáng kế 
thời gian tính toán biếu thức). 

4.4. Tỉnh giá trị biểu thức hậu tố 

Đe ý rằng khi tính toán biểu thức, máy sẽ phải quan tâm tới việc tính biểu thức ở 
hai nhánh con trước, rồi mới xét đến toán tử ở nút gốc. Điều đó làm ta nghĩ tới 
phép duyệt cây theo thứ tự sau và ký pháp hậu tố. Năm 1920, nhà lô-gic học 
người Balan Jan Lukasiewicz đã chứng minh rằng biểu thức hậu tố không cần 
phải có dấu ngoặc vẫn có thể tính được một cách đúng đắn bằng cách đọc lần 
lượt biểu thức từ trái qua phải và dùng một Staclc để lưu các kết quả trung gian: 

• Bước 1: Khởi tạo một ngăn xếp rồng 

• Bước 2: Đọc lần lượt các phần tử của biếu thức RPN từ trái qua phải (phần 
tử này có thể là hằng, biến hay toán tử) với mỗi phần tử đó: 

■ Neu phần tử này là một toán hạng thì đẩy giá trị của nó vào ngăn xếp. 

■ Neu phần tử này là một toán tử ♦, ta lấy từ ngăn xếp ra hai giá trị (y và 
x) sau đó áp dụng toán tử ♦ đó vào hai giá trị vừa lấy ra, đấy kết quả 
tìm được (x4y) vào ngăn xếp (ra hai vào một). 
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• Bước 3: Sau khi kết thúc bước 2 thì toàn bộ biểu thức đã được đọc xong, 
trong ngăn xếp chỉ còn duy nhất một phần tử, phần tử đó chính là giá trị của 
biểu thức. 

Ví dụ: Tính biếu thức 62/4 + 83 — X tương ứng với biếu thức trung tố 
(6/2 + 4) X (8 - 3) 


Đọc 

Xử lý 

Ngăn xếp 

6 

Đây vào 6 

6 

2 

Đây vào 2 

6,2 

/ 

Lấy ra 2 và 6, đấy vào 6/2 = 3 

3 

4 

Đây vào 4 

3,4 

+ 

Lấy ra 4 và 3, đấy vào 3 + 4 = 7 

7 

8 

Đây vào 8 

7,8 

3 

Đây vào 3 

7,8,3 

- 

Lấy ra 3 và 8, đấy vào 8 — 3 = 5 

7,5 

X 

Lấy ra 5 và 7, đấy vào 7x5 = 35 

35 


Ta được kết quà là 35 

Dưới đây ta sẽ viết một chuông trình đon giản tính giá trị biếu thức RPN. 

Input 

Biểu thức số học RPN, hai toán hạng liền nhau được phân tách bởi dấu cách. 
Các toán hạng là số thực, các toán tử là +, -, * hoặc /. 

Output 

Ket quả biếu thức 


Sample Input 

Sample Output 

62/4 + 83-* 

35.0000 


Đe đon giản, chuông trình không kiểm tra lồi viết sai biểu thức RPN, việc đó chỉ 
là thao tác tỉ mỉ chứ không phức tạp lắm, chỉ cần xem lại thuật toán và cài thêm 
các lệnh bắt lồi tại mồi bước. 


H RPNCALC.PAS s Tính giá trị biểu thức RPN 


{$MODE OBJFPC} 

program CalculatingRPNExpression; 

type 
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TStackNode = record 

//Ngăn xếp được cài đặt bằng clanh sách móc nối kiếu LIFO 
value: Real; 
link: Pointer; 

end; 

PStackNode = A TStackNode; 

var 

RPN: AnsiString; 
top: PStackNode; 
procedure Push(const v: Real); 

//Đấy một toán hạng là so thực V vào ngăn xếp 

var p: PStackNode; 

begin 

New(p); 

p A .value := v; 
p A .link := top; 
top := p; 

end; 

íunction Pop : Real; //Lấy một toán hạng ra khỏi ngăn xếp 
var p: PStackNode; 

begin 

Result := top A .value; 
p := top A .link; 

Dispose (top); 
top := p; 

end; 

procedure ProcessToken(const token: AnsiString); 

//Xử lý một phần tử trong biếu thức RPN 

var 

X, y: Real; 
err: Integer; 

begin 

if token[1] in '/'] then 

//Nếu phần tử token là toán tử 

begin //Lấy ra hai phần tử khỏi ngăn xếp, thực hiện toán tử và đấy giá trị vào ngăn xếp 

ỵ := Pop; 

X := Pop; 
case token[l] of 
' + ' : Push (x + ỵ) ; 
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'-': Push(x - ỵ); 

'*': Push(x * ỵ); 

'/': Push(x / ỵ); 

end; 

end 

else //Nếu phần tử token là toán hạng thì đấy giá trị của nó vào ngăn xếp 

begln 

Val(token, X, err); 

Push (x) ; 

end; 

end; 

procedure Parsing; //Xửlý biểu thức RPN 
var i, j: Integer; 

begin 

j : = 0 ; //ị là vị trí đã xử lý xong 

for i := 1 to Length (RPN) do //Quét biểu thức từ trái sang phải 

if RPN[i] in [' '/'] then 

//Nếu gặp toán tử hoặc dấu phân cách toán hạng 

begin 

if i > j + 1 then //Trước vị trí i có một toán hạng chưa xử lý 
ProcessToken(Copỵ(RPN, j + 1, i - j - 1)); 

//Xử lý toán hạng đó 

if RPN[i] in '/'] then 

//Nếu vị trí i chứa toán tử 

ProcessToken(RPN[i] ) ; //Xử lý toán tử đó 
j : = i; //Đã xử lý xong đến vị trí i 

end; 

if j < Length(RPN) then 

//Trường hợp có một toán hạng còn sót lại (biếu thức chỉ có 1 toán hạng) 

ProcessToken(Copy(RPN, j + 1, Length(RPN) - j)); 

//Xử lý nốt 

end; 

begin 

ReadLn(RPN) ; //Đọc biểu thức 
top : = ni 1; //Khởi tạo ngăn xếp rỗng, 

Parsing; //Xửlý 

Write (Pop : 0 : 4 ) ; //Lấy ra phần tử duy nhất còn lại trong ngăn xếp và in ra kết quà. 

end. 
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4.5. Chuyển từ dạng trung tố sang hậu tố 

Có thể nói rằng việc tính toán biếu thức viết bằng ký pháp nghịch đảo Balan là 
khoa học hơn, máy móc và đơn giản hơn việc tính toán biếu thức viết bằng ký 
pháp trung tố. Chỉ riêng việc không phải xử lý dấu ngoặc đã cho ta thấy ưu điểm 
của ký pháp RPN. Chính vì lý do này, các chương trình dịch vẫn cho phép lập 
trình viên viết biếu thức trên ký pháp trung tố theo thói quen, nhưng trước khi 
dịch ra các lệnh máy thì tất cả các biếu thức đều được chuyển về dạng RPN. vấn 
đề đặt ra là phải có một thuật toán chuyến biểu thức dưới dạng trung tố về dạng 
RPN một cách hiệu quả, dưới đây ta trình bày thuật toán đó: 

Thuật toán sử dụng một ngăn xếp Stack đế chứa các toán tử và dấu ngoặc mở. 
Thủ tục Push(v ) đế đấy một phần tử vào Stack, hàm Pop để lấy ra một phần tử 
từ Stack, hàm Get đế đọc giá trị phần tử nằm ở đỉnh Stack mà không lấy phần 
tử đó ra. Ngoài ra mức độ ưu tiên của các toán tử được quy định bằng hàm 
Priority : Ưu tiên cao nhất là dấu nhân (*) và dấu chia (/) với mức ưu tiên là 2, 
tiếp theo là dấu cộng (+) dấu (-) với mức ưu tiên là 1, ưu tiên thấp nhất là dấu 
ngoặc mở với mức ưu tiên là 0. 
stack := 0; 

for «phần tử token đọc được từ biểu thức trung tố» do 
case token of 

//token có thế là toán hạng, toán tử, hoặc dấu ngoặc được đọc lần lượt theo thứ tự từ trái qua phải 
' : Push (token) ; //Gặp dấu ngoặc mở thì đấy vào ngăn xếp 

//Gặp dấu ngoặc đóng thì lấy ra và hiến thị các phần tử trong ngăn xếp cho tới khi lấy tới dấu 
ngoặc mở 

repeat 

X := Pop; 

if X # '(' then Output <— x; 

until X = '('; 

' + //Gặp toán tử 

begin 

//Chù ng nào đỉnh ngăn xếp có phần tử với mức ưu tiên lớn hơn hay bằng token, lấy phần tử đó ra 
và hiên thị 

Víhile (Stack Ỷ 0) 

and (Prioritỵ(token) < Priority(Get)) do 
Output <— Pop; 

Push(token) ; //Đấy toán tử token vào ngăn xếp 
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end; 

else //Gặp toán hạng thì hiên thị luôn 

Output <— token; 

end; 

//Khi đọc xong biếu thức, lấy ra và hiến thị tất cả các phần tử còn lại trong ngăn xếp 

whỉle stack + 0 do 

Output <— Pop 


Ví dụ với biểu thức trung tố (6/2 + 4) X (8 — 3) 


Đọc 

Xử lý 

Ngăn xếp 

Output 

Chú thích 

( 

Đấy “(” vào ngăn xếp 

( 



6 

Hiên thị 

( 

6 


/ 

Đấy “/” vào ngăn xếp 

(/ 

6 

ti ỵ55 6íựì 

2 

Hiên thị 

(/ 

6 2 


+ 

Lấy “/” khỏi ngăn xếp và hiên 
thị, đẩy “+” vào ngăn xếp 

(+ 

6 2/ 

tiựì ^ íí_|_55 ^ Ítỵ55 

4 

Hiên thị 

(+ 

6 2/4 


) 

Lấy “+” và “(” khỏi ngăn xếp, 
hiển thị “+” 

0 

62/4 + 


X 

Đấy “x” vào ngăn xếp 

X 

62/4 + 


( 

Đấy “(” vào ngăn xếp 

x( 

62/4 + 


8 

Hiên thị 

x( 

62/4+8 


_ 

Đây vào ngăn xêp 

x(- 

62/4+8 

ti 55 tt^55 

3 

Hiên thị 

x(- 

62/4+83 


) 

Lấy và “(” khỏi ngăn xếp, 

hiển thị 

X 

6 2/4 + 8 3 - 


Hết 

Lấy nốt “x” ra và hiến thị 

0 

62/4+83 -X 



Thuật toán này có tên là thuật toán “xếp toa tàu” (shunting yards ) do Edsger 
Dykstra đề xuất năm 1960. Tên gọi này xuất phát từ mô hình đuờng ray tàu hỏa: 
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Hình 1.19. Mô hình “xếp toa tàu” của thuật toán chuyến từ dạng trung tồ sang hậu tố 

Trong hình 1.19, mồi toa tàu tưong ứng với một phần tử trong biếu thức trung tố 
nằm ở “đuờng ray” Infix. Có ba phép chuyển toa tàu: Từ đuờng ray Infix sang 
thắng đuờng ray RPN, từ đuờng ray Infix xuống đuờng ray Stack, hoặc từ 
đuờng ray Stack lên đuờng ray RPN. Thuật toán chỉ đon thuần dựa trên các luật 
chuyến mà theo các luật đó ta sẽ chuyển đuợc tất cả các toa tàu sang đuờng ray 
RPN để đuợc một thứ tự tuông ứng với biểu thức hậu tố* (ví dụ toán hạng ở 
Infix sẽ đuợc chuyên thăng sang RPN hay dâu “(” ở Infix sẽ đuợc chuyên 
thẳng xuống Stack). 

Duới đây là chuông trình chuyến biểu thức viết ở dạng trung tố sang dạng RPN: 

Input 

Biểu thức trung tố 

Output 

Biểu thức hậu tố 


Sample Input 

Sample Output 

(6/2+4) * (8-3) 

62/4 + 83-* 


H 

INFIX2RPN.PAS 'P Chuyển từ dạng trung tố sang hậu tố 


{$MODE OBJFPC} 


Thực ra thì còn thao tác loại bỏ các dấu ngoặc trong biếu thức RPN nữa, nhung điều này không quan 
trọng, dấu ngoặc là thừa trong biếu thức RPN vì nhu đã nói về phuơng pháp tính: biếu thức RPN có thế 
tính đơn định mà không cẩn các dấu ngoặc. 
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program ConvertInfixToRPN; 

type 

TStackNode = record 

// Ngăn xếp được cài đặt bằng danh sách móc nối kiều LIFO 

value: AnsiChar; 
link: Pointer; 

end; 

PStackNode = '■'TStackNode; 

var 


Infix: AnsiString; 
top: PStackNode; 

procedure Push(const c: AnsiChar) ; //Đẩy một phần tử V vào ngăn xếp 
var p: PStackNode; 

begin 

New(p); 

p^.value := c; 
p^.link := top; 
top := p; 

end; 

function Pop : AnsiChar; //Lấy một phần tử ra khỏi ngăn xếp 
var p: PStackNode; 

begin 

Result := top^.value; 
p := top^.link; 

Dispose (top); 
top := p; 

end; 

f unction Get: Ans iChar; //Đọcphần tử ở đỉnh ngăn xếp 

begin 

Result := top^.value; 

end; 

function Prioritỵ(c: Char) : Integer; //Mức ưu tiên của các toán tử 

begin 

case c of 


'*', '/': Result := 2; 
'+', '-': Result := 1; 
'(': Result := 0; 

end; 
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end; 

//Xử lý một phần tử đọc được từ biếu thức trung tố 

procedure ProcessToken (const token: AnsiString); 

var 

x: AnsiChar; 

Opt: AnsiChar; 

begin 

Opt := token[1]; 

case Opt of 

' ( ' : Push (Opt) ; //token là dấu ngoặc mở 
' ) ' : //token là dấu ngoặc dóng 

repeat 

X := Pop; 

if X <> '(' then Write(x, ' ') 

else Break; 
until False; 

' + ' * ' , //token là toán tử 

begin 

Víhile (top <> nil) 

and (Prioritỵ(Opt) <= Priority(Get)) do 
Write (Pop, ' '); 

Push(Opt); 

end; 

else //token là toán hạng 

Write (token, ' '); 

end; 

end; 

procedure Parsing; 

const Operators = [' (', ') ', ' + ', ' - ' , '* ' , ' / ' ] ; 

var i, j: Integer; 

begin 

j : = 0 ; //ị là vị trí đã xử lý xong 

for i := 1 to Length(Infix) do 

if Infix[i] in Operators + [' '] then 

//Nếu gặp dấu ngoặc, toán từ hoặc dấu cách 

begln 

if i > j + 1 then //Trước vị trí i có một toán hạng chưa xử lý 
ProcessToken(Copỵ(Infix, j + 1, i - j - 1)); 
//xử lý toán hạng đó 
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if Infix[i] in Operators then 
//Nếu vị trí i chứa toán tử hoặc dấu ngoặc 

ProcessToken (Infix [i] ) ; //Xử lý ký tự đó 
j : = i; //Cập nhật, đã xử lý xong đến vị trí i 

end; 

if j < Length (Inf ix) then //Xử lý nốt toán hạng còn sót lại 
ProcessToken (Copy(Infix, j + 1, Length(Infix) - j)); 
//Đọc hết biếu thức trung tố, lấy nốt các phần tử trong ngăn xếp ra và hiến thị 
while top <> nil do 
Write (Pop, ' ' ); 

WriteLn; 

end; 

begin 

ReadLn(Infix) ; //Nhập dữ liệu 

top : = nil ; //Khởi tạo ngăn xếp rỗng 

Parsing ; //Đọc biếu thức trung tố và chuyến thành dạngRPN 

end. 

4.6. Xây dựng cây nhị phân biểu diễn biểu thức 

Ngay trong phần đầu tiên, chúng ta đã biết rằng các dạng biếu thức trung tố, tiền 
tố và hậu tố đều có thế đuợc hình thành bằng cách duyệt cây nhị phân biểu diễn 
biểu thức đó theo các trật tự khác nhau. Vậy tại sao không xây dựng ngay cây 
nhị phân biếu diễn biểu thức đó rồi thực hiện các công việc tính toán ngay trên 
cây?. Khó khăn gặp phải chính là thuật toán xây dựng cây nhị phân trực tiếp từ 
dạng trung tố có thể kém hiệu quả, trong khi đó từ dạng hậu tố lại có thể khôi 
phục lại cây nhị phân biểu diễn biếu thức một cách rất đon giản, gần giống nhu 
quá trình tính toán biếu thức hậu tố: 

• Buớc 1: Khởi tạo một ngăn xếp rồng dùng đế chứa các nút trên cây 

• Buớc 2: Đọc lần luợt các phần tử của biểu thức RPN từ trái qua phải (phần 
tử này có thể là hằng, biến hay toán tử) với mỗi phần tử đó: 

■ Tạo ra một nút mới z chứa phần tử mới đọc đuợc 

■ Neu phần tử này là một toán tử, lấy từ ngăn xếp ra hai nút (theo thứ tự 

là y và x), cho X trở thành con trái và y trở thành con phải của nút z 

■ Đấy nút z vào ngăn xếp 
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• Bước 3: Sau khi kết thúc bước 2 thì toàn bộ biểu thức đã được đọc xong, 
trong ngăn xếp chỉ còn duy nhất một phần tử, phần tử đó chính là gốc của 
cây nhị phân biểu diễn biểu thức. 


Bài tập 

1 . 12 . Biểu thức có thể có dạng phức tạp hon, chẳng hạn biểu thức bao gồm cả 
phép lấy số đối (— X ), phép tính lũy thừa (x y ), hàm số với một hay nhiều 
biến số. Chúng ta có thế biểu diễn những biểu thức dạng này bằng một cây 
tổng quát và từ đó có thể chuyến biểu thức về dạng RPN để thực hiện tính 
toán. Hãy xây dựng thuật toán để chuyển biểu thức số học (dạng phức tạp) 
về dạng RPN và thuật toán tính giá trị biểu thức đó. 

1 . 13 . Viết chuông trình chuyển biểu thức logic dạng trung tố sang dạng RPN. Ví 
dụ chuyển: a and b or c and d thành: a b and c d and or. 

1 . 14 . Chuyển các biểu thức sau đây ra dạng RPN 

a) A X (B + C) 

b) A + (B/C) + D 

c) A X (B + -C) 

d) A-(B + C) d/e 

e) (A or 5) and (c or (D or not £■)) 

f) 04 = ổ) or (C = D ) 

1 . 15 . Với một ảnh đen trắng hình vuông kích thước 2 n X 2 n , người ta dùng 
phưong pháp sau đê mã hóa ảnh: 

• Neu ảnh chỉ gồm toàn điểm đen thì ảnh đó có thế được mã hóa bằng xâu chỉ 
gồm một ký tự ‘B’ 

• Neu ảnh chỉ gồm toàn điểm trắng thì ảnh đó có thế được mã hóa bằng xâu 
chỉ gồm một ký tự ‘W’ 

• Neu p, Q,R,S lần lượt là xâu mã hóa của bốn ảnh vuông kích thước bằng 
nhau thì &.PQRS là xâu mã hóa của ảnh vuông tạo thành bằng cách đặt 4 
ảnh vuông ban đầu theo sơ đồ: 
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p Q 
s R 


Ví dụ “&B&BWWBW&BWBW” và 

“&&BBBB&BWWBW&BWBW” là hai xâu mã hóa của 
cùng một ảnh bên: 

Bài toán đặt ra là cho số nguyên duong n và hai xâu mã hóa 
của hai ảnh kích thuớc 2 n X 2 n . Hãy cho biết hai ảnh đó có khác nhau 
không và nếu chúng khác nhau hãy chỉ ra một vị trí có màu khác nhau trên 
hai ảnh. 



5. Cây nhị phân tìm kiếm 

5.1. cấu trúc chung của cây nhị phân tìm kiếm 

Cây nhị phân tìm kiếm (binary search tree-BST) là một cây nhị phân, trong đó 
mỗi nút chứa một phần tử (khóa). Khóa chứa trong mỗi nút phải lớn hon hay 
bằng mọi khóa trong nhánh con trái và nhỏ hơn hay bằng mọi khóa trong nhánh 
con phải. 

Ớ đây chúng ta giả sử rằng các khóa lưu trữ trong cây đuợc lấy từ một tập hợp s 
có quan hệ thứ tự toàn phần. 



Hình 1.20. Cây nhị phân tìm kiếm 

CÓ thế có nhiều cây nhị phân tìm kiếm biếu diễn cùng một bộ khóa. Hình 1.20 là 
ví dụ về hai cây nhị phân tìm kiếm biểu diễn cùng một bộ khóa (1,2,3,4,5,6). 
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Định lý 5.1 

Neu duyệt cây nhị phân tìm kiếm theo thứ tự giữa, các khóa trên cây sẽ được liệt 
kê theo thứ tự không giảm (tăng dần). 

Chứng minh 

Ta chứng minh định lý bằng quy nạp: Rõ ràng định lý đúng với BST chi có một nút. Giả sử 
định lý đúng với mọi BST có ít hơn n nút, xét một BST bất kỳ gồm n nút, và ở nút gốc 
chứa khóa k, thuật toán duyệt cây theo thứ tự giữa truớc hết sẽ liệt kê tất cả các khóa trong 
nhánh con trái theo thứ tự không giảm (giả thiết quy nạp), các khóa này đều < k (tính chất 
của cây nhị phân tìm kiếm). Tiếp theo thuật toán sẽ liệt kê khóa k của nút gốc, cuối cùng, 
lại theo giả thiết quy nạp, thuật toán sẽ liệt kê tất cả các khóa trong nhánh con phải theo thứ 
tự không giảm, tuơng tự nhu trên, các khóa trong nhánh con phải đều > k. Vậy tất cả n 
khóa trên BST sẽ đuợc liệt kê theo thứ tự không giảm, định lý đúng với mọi BST gồm n 
nút. ĐPCM. 

5.2. Các thao tác trên cây nhị phân tìm kiếm 
a) Cấu trúc nút 

Chúng ta sẽ biểu diễn BST bằng một cấu trúc liên kết các nút động và con trỏ 
liên kết. Mồi nút trên BST sẽ là một bản ghi gồm 3 trường: 

• Trường key : Chứa khóa lưu trong nút. 

• Trường parent: Chứa liên kết (con trỏ) tới nút cha, nếu là nút gốc (không 
có nút cha) thì trường parent được đặt bằng một con trỏ đặc biệt, ký hiệu 
nilT. 

• Trường left: Chứa liên kết (con trỏ) tới nút con trái, nếu nút không có 
nhánh con trái thì trường left được đặt bằng nilT. 

• Trường right : Chứa liên kết (con trỏ) tới nút con phải, nếu nút không có 
nhánh con phải thì trường right được đặt bằng nilT. 

Neu các khóa chứa trong nút có kiểu TKey thì cấu trúc nút của BST có thể được 
khai báo như sau: 

type 

PNode = '■'TNode; //Kiểu con trỏ tói một nút 

TNode = record 
keỵ: TKey; 

parent, left, right: PNode; 

end; 

var 
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sentinel: TNode; 

nilT: 

PNo de ; //Con trỏ tới nút đặt biệt 

root: 

PNo de ; //Con trỏ tới nút gốc 

begin 


nilT 

:= @sentinel; 

end. 



Các ngôn ngữ lập trình bậc cao thường cung cấp hằng con trỏ nil (hay null ) đế 
gán cho các liên kết không tồn tại trong cấu trúc dữ liệu. Hằng con trỏ nil chỉ 
được sử dụng để so sánh với các con trỏ khác, không được phép truy cập biến 
động níZ A . 

Trong cài đặt BST, chúng ta sử dụng con trỏ nilT có công cụng tưong tự như 
con trỏ nil: gán cho những liên kết không có thực. Chỉ có khác là con trỏ nilT 
trỏ tới một biến sentinel có thực, chỉ có điều các trường của ni/r A là vô nghĩa 
mà thôi. Chúng ta hy sinh một ô nhớ cho biến sentinel — nilT* để đon giản hóa 
các thao tác trên BST*. 

b) Khởi tạo cây rỗng 

Trong cấu trúc BST khai báo ở trên, ta quy ước một cây rồng là cây có gốc 
Root — nilT, phép khởi tạo một BST rồng chỉ đon giản là: 

procedure MakeNull; 
begin 

root := nilT; 

end; 

c) Tìm khóa lớn nhất và nhỏ nhất 

Theo Định lí 5.1, khóa nhỏ nhất trên BST nằm trong nút được thăm đầu tiên và 
khóa lớn nhất của BST nằm trong nút được thăm cuối cùng nếu ta duyệt cây 
theo thứ tự giữa. Như vậy nút chứa khóa nhỏ nhất (lớn nhất) của BST chính là 
nút cực trái (cực phải) của BST. Hàm Minimum và Maximum dưới đây lần 


Mục đích của biến này là đế bớt đi thao tác kiếm tra con trỏ p ^ nil trước khi truy cập nút p A . 
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lượt trả về nút chứa khóa nhỏ nhất và lớn nhất trong nhánh cây BST gốc X (ở 
đây ta giả thiết rằng nhánh BST gốc X khác rồng: X nilT ) 

function Minimum(x: PNode) : PNode; //Khóa nhỏ nhất nằm ở nút cực trái 

begln 

while X A . 1 e f t Ỷ nilT do //Đi sang nút con trái chừng nào vẫn còn đi được 
X := X A .left; 

Result := x; 

end; 

function Maximum(x: PNode) : PNode; //Khóa lớn nhất nằm ở nút cực phải 

begin 

while X A . right Ỷ nilT do //Đi sang nút con phải chùng nào vẫn còn đi được 
X := X A .right; 

Result := x; 

end; 

d) Tìm nút liền trước và nút liền sau 

Đôi khi chúng ta phải tìm nút đứng liền trước và liền sau của một nút X nếu 
duyệt cây BST theo thứ tự giữa. Trước hết ta xét viết hàm PrecLecessor(x) trả 
về nút đứng liền trước nút X, xét hai trường hợp: 

• Neu X có nhánh con trái thì trả về nút cực phải của nhánh con trái: 
Result ■■= Maximum(x A .Left) . 

• Neu X không có nhánh con trái thì từ X, ta đi dần lên phía gốc cây cho tới 
khi gặp một nút chứa X trong nhánh con phải thì dừng lại và trả về nút đó. 

function Predecessor(x: PNode): PNode; 

begin 

if X A .left Ỷ nilT then //x có nhánh con trái 

Result : = Max imum ( X A . 1 e f t ) //Trả về nút cực phải của cây con trái 

else 

repeat 

Result := x A .parent; 

//Nếu X là gốc hoặc X là nhánh con phải thì thoát ngay 

if (Result = nilT) 

or (x = Result A .right) then Break; 

X : = Result ; //Nếu không thì đi tiếp lên phía gốc 
until False; 

end; 
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Hàm Successor(x ) trả về nút liền sau nút X có cách làm tương tự nếu ta đối vai 
trò Left và Right, Minimum và Maximum: 

function Successor(x: PNode): PNode; 

begin 

if X A .right Ỷ nilT then //x có nhánh con phải 

Result := Minimum (x A . right) //Trả về nút cực trái của cây con phải 

else 

repeat 

Result := X A .parent; 

//Nếu X là gốc hoặc X là nhánh con trái thì thoát ngay 
if (Result = nilT) 

or (x = Result A . left) then Break; 

X := Result ; //Đi tiếp lên phía gốc 
until False; 

end; 

e) Tìm kiếm 

Phép tìm kiếm nhận vào một nút X và một khóa k. Neu khóa k có trong nhánh 
BST gốc X thì trả về một nút chứa khóa k, nếu không trả về nilT. 

Phép tìm kiếm trên BST có thể cài đặt bằng hàm Search, hàm này được xây 
dựng dựa trên nguyên lý chia để trị: Nếu nút X chứa khóa = k thì hàm đơn giản 
trả về nút X, nếu không thì việc tìm kiếm sẽ được tiến hành tương tự trên cây 
con trái hoặc cây con phải tùy theo nút X chứa khóa nhỏ hơn hay lớn hơn k: 

//Hàm Search trả về nút chứa khóa k, trả về nilT nếu không tìm thấy khóa k trong nhánh gốc X 

function Search(x: PNode; const k: TKeỵ): PNode; 

begin 

vrhỉle (x Ỷ nilT) and (x A .key Ỷ k) do //Chùng nào chưa tìm thấy 
if k < X A .key then X := x A .left 
//k chắc chắn không nằm trong cây con phải, tìm trong cây con trái 

else X := x A .right; 

//k chắc chắn không nằm trong cây con trái, tìm trong cây con phải 
Result := x; 

end; 
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f) Chèn 

Chèn một khóa k vào BST tức là thêm một nút mới chứa khóa k trên BST và 
móc nối nút đó vào BST sao cho vẫn đảm bảo cấu trúc của một BST. Phép chèn 
cũng được thực hiện dựa trên nguyên lý chia để trị: Bài toán chèn k vào cây 
BST sẽ được quy về bài toán chèn k vào cây con trái hay cây con phải, tùy theo 
khóa k nhỏ hon hay lớn hon hoặc bằng khóa chứa trong nút gốc. Trường hợp co 
sở là k được chèn vào một nhánh cây rồng, khi đó ta chỉ việc tạo nút mới, móc 
nối nút mới vào nhánh rồng này và đặt khóa k vào nút mới đó. 



Hình 1.11. Cây nhị phân tìm kiếm trước và sau khi chèn khóa V = 6 

Trước tiên ta viết một thủ tục SetLink(ParentNode, ChildNode, InLeft) để 
chỉnh lại các liên kết sao cho nút ChildNode trở thành nút con của nút 
ParentNode: 

procedure SetLink(ParentNode, ChildNode: PNode; 

InLeft: Boolean); 

begin 

ChildNode A .parent := ParentNode; 

if InLeft then ParentNode A .left := ChildNode 

//InLeýt = True: Cho ChihlNode thành nút con trái của ParentNode 
else ParentNode A .right := ChildNode; 

//InLeýt = False: Cho ChildNode thành nút con phải của ParentNode 

end; 

Khi đó thủ tục chèn một nút NewNode A vào BST có thế viết như sau 

//Chèn k vào BST, trả về nút mói chứa k 
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function Insert(k: TKeỵ): PNode; 
var X, ỵ: PNode; 

begin 

ỵ := nilT; 

X := root; //Bắt đầu từ gốc 
while X # nilT do 
begin 

ỵ : = X ; 

if k < X''' . keỵ then X := xVleft //Chèn vào nhánh trái 
else X := xVright; //Chèn vào nhánh phải 

end; 

New (x) ; //Tạo nút mới chứa k 

X V keỵ := k; 
xVleft := nilT; 

XVright := nilT; 

SetLink (ỵ, X, k < y A .key); //Móc nối vào BST 
if root = nilT then root := x; 

//Cập nhật lại gốc nếu là nút đầu tiên được chèn vào 
Result := x; 

end; 

g) Xóa 

Việc xóa một nút X trong BST thực chất là xóa đi khóa chứa trong nút X. Phép 
xóa được thực hiện như sau: 

• Neu X có ít hon hai nhánh con, ta lấy nút con (nếu có) của X lên thay cho X 
và xóa nút X. 

• Neu X có hai nhánh con, ta xác định nút y là nút cực phải của nhánh con trái 
(hoặc nút cực trái của cây con phải), đưa khóa chứa trong nút y lên nút X rồi 
xóa nút y. Chú ý rằng nút y chắc chắn không có đủ hai nút con, việc xóa 
quy về trường hợp trên. (h. 1.22) 
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procedure Delete(x: PNode); 
var y, z: PNode; 

begin 

if (x A .left ^ nilT) and (x A .right ^ nilT) then 

//x có hai nhánh con 

begin 

ỵ := Maximum (x A . lef t) ; //Tìm nút cực phải của cây con trái 
X A . key := y A .key; //Đưa khóa của nút y lên nút X 
X := y; 

end; 

//Vấn để bây giờ là xóa nút X có nhiều nhất một nhánh con, xác định y là nút con (nếu có) của X 
if x A .left ^ nilT then y := x A .left 
else ỵ := x A .right; 
z := X A .parent; //z là cha của X 
//cho y làm con của z thay cho X 
SetLink(z, ỵ, z A .left = x) ; 
if X = root then root := y; 

//Trường hợp nút X bị hủy là gốc thì cập nhật lại gốc là y 
Dispose (X) ; //Giảiphóng bộ nhớ cấp cho nútX 
end; 

h) Phép quay cây 

Phép quay cây là một phép chỉnh lại cấu trúc liên kết trên BST, có hai loại: quay 
trái (left rotation ) và quay phải (rỉght rotation ). 

Khi ta thực hiện phép quay trái trên nút X, chúng ta giả thiết rằng nút con phải 
của X 1 ày ^ nil. Trên cây con gốc X, phép quay trái sẽ đua y lên làm gốc mới, X 
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trở thành nút con trái của y và nút con trái của y trở thành nút con phải của X. 

^ R 

Phép quay này còn gọi là quay theo liên kêt X -» y. 

Ngược lại, phép quay phải thực hiện trên những cây con gốc y mà nút con trái 
của y là X nilT. Sau phép quay phải, X sẽ được đưa lên làm gốc nhánh, y trở 
thành nút con phải của X và nút con phải của y trở thành nút con trái của X. Phép 

, L 

quay này còn gọi là quay theo liên kêt y -* X. 

Dễ thấy rằng sau phép quay, ràng buộc về quan hệ thứ tự của các khóa chứa 
trong cây vẫn đảm bảo cho cây mới là một BST. 

Hình 5.4 mô tả hai phép quay trên cây nhị phân tìm kiếm. 




Hình 1.23. Phép quay cây 

Các thuật toán quay trái và quay phải có thế viết như sau: 

procedure RotateLeft(x: PNode); 
var ỵ, z, branch: PNode; 

begin 

ỵ := X A .right; 
z := X A .parent; 
branch := y A .left; 

SetLink(x, branch, False) ; //Cho branch trở thành con phải của X 
SetLink (ỵ, X, True) ; //Cho X trở thành con trái của y 
SetLink ( z , y, (z A .left = x) ) ; //Móc noi y vào làm con của z thay cho X 
if root = X then root := y; //Cập nhật lại gốc cây nếu trước đây X là gốc 

end; 
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procedure RotateRight(ỵ: PNode); 
var X, z, branch: PNode; 

begin 

X := y A .left; 
z := y A .parent; 
branch := x A .right; 

SetLink (y, branch, True) ; //Cho branclt trở thành con trái cùa y 
SetLink (x, y, False) ; //Cho y trở thành con phải của X 
SetLink ( z , X, Z A .left = ỵ) ; //Móc nối X vào làm con cùa I thay cho y 
if root = y then root := x; //Cập nhật lại gốc cây nếu trước đây y là gốc 

end; 

Dễ thấy rằng một BST sau phép quay vẫn là BST. Chúng ta có thể viết một thao 
tác UpTree(x) tổng quát hơn: Với X root , và y — x A .parent , phép 
UpTree(x) sê quay theo liên kết y —> X đế đẩy nút X lên phía gốc cây (độ sâu 
của X giảm 1) và kéo nút y xuống sâu hơn một mức làm con nút X. 

procedure UpTree(x: PNode); 
var y, z, branch: PNode; 

begin 

y := X A .parent; //y A là nút cha của JC A 
z := y A .parent; //z A là nút cha của y A 
if X = ỵ A .left then //Quayphải 

begin 

branch := x A .right; 

SetLink(ỵ, branch, True); 

//Chuyến nhánh gốc lì ran ch A cfiax A sang làm con trái y A 
SetLink(x, y, False) ; //Cho y A làm con phải X A 

end 

else //Quay trái 

begin 

branch := x A .left; 

SetLink(y, branch, False); 

//Chuyến nhánh gốc branch A củax A sang làm con phảiy A 
SetLink(x, y, True) ; //Cho y A làm con trái X A 

end; 

SetLink (z , X, z A .left = y) ; //Móc nối X A vào làm con Z A thay cho y A 
if root = y then root := x; 

//Cập nhật lại gốc BST nếu trước đâty A là gốc 
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end; 

5.3. Hiệu lực của các thao tác trên cây nhị phân tìm kiếm 

Có thể chứng minh được rằng các thao tác Minimum , Maximum , 
Predecessor, Successor, Search, Insert đều có thời gian thực hiện 0(/i) với 
h là chiều cao của cây nhị phân tìm kiếm. Hon nữa, trong trường hợp xấu nhất, 
các thao tác này đều có thời gian thực hiện 0(/i). 

Vậy khi lưu trữ n khóa bằng cây nhị phân tìm kiếm thì cấu trúc BST tốt nhất là 
cấu trúc cây nhị phân gần hoàn chỉnh (có chiều cao thấp nhất: h — [lgnj) còn 
cấu trúc BST tồi nhất để biểu diễn là cấu trúc cây nhị phân suy biến (có chiều 
cao h — n — 1). 

5.4. Cây nhị phân tìm kiếm tự cân bằng 

a) Tính cân bằng 

Đe tăng tính hiệu quả của các thao tác co bản trên BST, cách chung nhất là cố 
gắng giảm chiều cao của cây. Với một BST gồm n nút, dĩ nhiên giải pháp lý 
tưởng là giảm được chiều cao xuống còn [lgnj (cây nhị phân gần hoàn chỉnh) 
nhưng điều này thường làm ảnh hưởng nhiều tới thời gian thực hiện giải thuật. 
Người ta nhận thấy rằng muốn một cây nhị phân thấp thì phải cố gắng giữ được 
sự cân bằng (về chiều cao và số nút) giữa hai nhánh con của một nút bất kỳ. 
Chính vì vậy những ý tưởng ban đầu đế giảm chiều cao của BST xuất phát từ 
những kỳ thuật cân bằng cây, từ đó người ta xây dựng các cấu trúc dữ liệu cây 
nhị phân tìm kiếm có khả năng tự cân bang ( self-balancing binary search treè) 
với mong muốn giữ được chiều cao của BST luôn là một đại lượng o(lgn). 

b) Một số dạng BST tự cân bằng 
□ CâyẢVL 

Một trong những phát kiến đầu tiên về cấu trúc BST tự cân bằng là cây AVL 
[1]. Trong mồi nhánh cây AVL, chiều cao của nhánh con trái và nhánh con phải 
hon kém nhau không quá 1. Mồi nút của cây AVL chứa thêm một thông tin về 
hệ số cân bằng (độ lệch chiều cao giữa nhánh con trái và nhánh con phải). Ngay 
sau mỗi phép chèn/xóa, hệ số cân bằng của một số nút được cập nhật lại và nếu 
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phát hiện một nút có hệ số cân bằng > 2, phép quay cây sẽ được thực hiện đế 
cân bằng độ cao giữa hai nhánh con của nút đó. 

Một cây AVL có độ cao h thì có không ít hon f(h + 3) — 1 nút. Ở đây f(h + 3) 
là số íĩbonacci thứ h + 3. Các tác giả cũng chứng minh được rằng chiều cao của 
cây AVL có n nút trong là một đại lượng 5S 1.4404 lg(n + 2) — 0.328. 

□ Cây đỏ đen 

Một dạng khác của BST tự cân bằng là cây đỏ đen (Red-Black tree) [ 4 ]. Mồi nút 
của cây đỏ đen chứa thêm một bit màu (đỏ hoặc đen). Ngoài các tính chất của 
BST, cây đỏ đen thỏa mãn 5 tính chất sau đây: 

• Mọi nút đều được tô màu (đỏ hoặc đen) 

• Nút gốc root A có màu đen 

• Nút ni/r A có màu đen 

• Neu một nút được tô màu đỏ thì cả hai nút con của nó phải được tô màu đen 

• Với mỗi nút, tất cả các đường đi từ nút đó đến các nút lá hậu duệ có cùng 
một số lượng nút đen. 

Tưong tự như cây AVL, đi kèm với các phép chèn/xóa trên cây đỏ đen là những 
thao tác tô màu và cân bằng cây. Người ta chứng minh được rằng chiều cao của 
cây đỏ đen có n nút trong không vượt quá 2 lg(n + 1). Trên thực tế cây đỏ đen 
nhanh hon cây AVL ở phép chèn và xóa nhưng chậm hon ở phép tìm kiếm. 

□ Cây Splay 

Còn rất nhiều dạng BST tự cân bằng khác nhưng một trong những ý tưởng thú vị 
nhất là cây Splay [ 35 ]. Cây Splay duy trì sự cân bằng mà không cần thêm một 
thông tin phụ trợ nào ở mỗi nút. Phép “làm bẹp” cây được thực hiện mỗi khi có 
lệnh truy cập, những nút thường xuyên được truy cập sê được đẩy dần lên gần 
gốc cây đế có tốc độ truy cập nhanh hon. Các phép tìm kiếm, chèn và xóa trên 
cây Splay cũng được thực hiện trong thời gian o(lgn) (đánh giá bù trừ). Trong 
trường hợp tần suất thực hiện phép tìm kiếm trên một khóa hay một cụm khóa 
cao hon hắn so với những khóa khác, cây splay sẽ phát huy được ưu thế về mặt 
tốc độ. 
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c) vấn đề chứng minh lý thuyết và cài đặt 

Cây AVL và cây đỏ đen thường được đưa vào giảng dạy trong các giáo trình cấu 
trúc dữ liệu vì các tính chất của hai cấu trúc dữ liệu khá dễ dàng trong chứng 
minh lý thuyết. Cây Splay thường được sử dụng trong các phần mềm ứng dụng 
vì tốc độ nhanh và tính chất “nhanh hon nếu truy cập lại” (quick to access 
again). Ba loại cây này khá phố biến trong các thư viện hồ trợ của các môi 
trường phát triển cao cấp để viết các phần mềm ứng dụng. Lập trình viên có thế 
tùy chọn loại cây thích hợp nhất để cài đặt giải quyết vấn đề của mình. 

Trong trường hợp bạn lập trình trong thời gian hạn hẹp mà không có thư viện hồ 
trợ (chang hạn trong các kỳ thi lập trình), phải nói rằng việc cài đặt các loại cây 
kể trên không hề đon giản và dễ nhầm lần (bạn có thể tham khảo trong các tài 
liệu khác về co sở lý thuyết và kỹ thuật cài đặt các loại cây kế trên). Neu bạn cần 
sử dụng các cấu trúc dữ liệu này trong phần mềm, theo tôi các bạn nên sử dụng 
các thư viện sẵn có hoặc viết một thư viện lớp mẫu (class template) thật cấn thận 
để sử dụng lại. 

Tôi sẽ không đi vào chi tiết các loại cây này. Điều bạn phải nhớ chỉ là có tồn tại 
những cấu trúc như vậy, đế khi đánh giá một thuật toán có sử dụng BST, có thể 
coi các thao tác co bản trên BST được thực hiện trong thời gian o(lgn). 

Trong bài sau tôi sẽ giới thiệu một cấu trúc BST khác dễ cài đặt hon, dễ tùy biến 
hon, và tốc độ cũng không hề thua kém trên thực tế: cấu trúc Treap. 


Bài tập 

1 . 16 . Quá trình tìm kiếm trên BST có thế coi như một đường đi xuất phát từ nút 
gốc. Giáo sư X phát hiện ra một tính chất thú vị: Neu đường đi trong quá 
trình tìm kiếm kết thúc ở một nút lá, ký hiệu L là tập các giá trị chứa trong 
các nút nằm bên trái đường đi và R là tập các giá trị chứa trong các nút 
nằm bên phải đường đi. Khi đó Vx E L, y G R, ta có X < y. Chứng minh 
phát hiện của giáo sư X là đúng hoặc chỉ ra một phản ví dụ. 

1 . 17 . Cho BST gồm n nút, bắt đầu từ nút Minimum A , người ta gọi hàm 
Successor để đi sang nút liền sau cho tới khi duyệt qua nút Maximum*. 
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Chứng minh rằng thời gian thực hiện giải thuật này có thời gian thực hiện 
0(n). 

Gợi ỹ: Thực hiện n lời gọi Successor lên tiếp đơn giản chỉ là duyệt qua 
các liên kết cha/con trên BST mỗi liên kết tối đa 2 lần. Điều tuơng tự có 
thế chứng minh đuợc nếu ta bắt đầu từ nút Maximum A và gọi liên tiếp 
hàm Predecessor để đi sang nút liền truớc. 

1.18. Cho BST có chiều cao h, bắt đầu từ một nút p l5 nguời ta tìm nút p 2 là nút 
liền sau Pi- p 2 '■= Successor(j) i), tiếp theo lại tìm nút p 3 là nút liền sau 
p 2 ,... Chứng minh rằng thời gian thực hiện k lần phép Successor nhu vậy 
chỉ mất thời gian 0(/c + /i). 

1.19. (tree Sort) Nguời ta có thể thực hiện việc sắp xếp một dãy khóa bằng cây 
nhị phân tìm kiếm: Chèn lần luợt các giá trị khóa vào một cây nhị phân 
tìm kiếm sau đó duyệt cây theo thứ tự giữa. Đánh giá thời gian thực hiện 
giải thuật trong truờng hợp tốt nhất, xấu nhất và trung bình. Cài đặt thuật 
toán tree Sort. 

1.20. Viết thuật toán SearchLE(k) để tìm nút chứa khóa lớn nhất < k trong 
BST. 

1.21. Viết thuật toán SearchGE(k) để tìm nút chứa khóa nhỏ nhất > k trong 
BST. 

1.22. Viết thủ tục MovetoRoot(j) ) nhận vào nút p và dùng các phép quay đế 
chuyến nút p thành gốc của cây BST. 

1.23. Viết thủ tục MovetoLeaf(p ) nhận vào nút p và dùng các phép quay đế 
chuyên nút p thảnh một nút lá của cây BST. 

1.24. Radix tree (cây tìm kiếm cơ số) là một cây nhị phân trong đó mỗi nút có 
thế chứa hoặc không chứa giá trị khóa, (nguời ta thuờng dùng một giá trị 
đặc biệt tuơng ứng với nút không chứa giá trị khóa hoặc sử dụng thêm một 
bit đánh dấu những nút không chứa giá trị khóa) 

Các giá trị khóa lưu trữ trên Radix tree là các dãy nhị phân, hay tống quát 
hơn là một kiểu dữ liệu nào đó có thế mã hóa bằng các dãy nhị phân. Phép 
chèn một khóa vào Radix tree được thực hiện như sau: Bắt đầu từ nút gốc 
ta duyệt biếu diễn nhị phân của khóa, gặp bit 0 đi sang nút con trái và gặp 
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bit 1 đi sang nhánh con phải, mỗi khi không đi được nữa (đi vào liên kết 
nilT ), ta tạo ra một nút và nối nó vào cây ở chồ liên kết nilT vừa rẽ sang 
rồi đi tiếp. Cuối cùng ta đặt khóa vào nút cuối cùng trên đường đi. Hình 
dưới đây là Radix tree sau khi chèn các giá trị 1011, 10, 100, 0, 011. Các 
nút tô đậm không chứa khóa 



Gọi s là tập chứa các khóa là các dãy nhị phân, tổng độ dài các dãy nhị 
phân trong s là n. Chỉ ra rằng chúng ta chỉ cần mất thời gian 0(n) đế xây 
dựng Radix tree chứa các phần tử của s, mất thời gian 0(n) đế duyệt 
Radix tree theo thứ tự giữa và liệt kê các phần tử của s theo thứ tự từ điến. 

1 . 25 . Cho BST tạo thành từ n khóa được chèn vào theo một trật tự ngẫu nhiên, 
gọi Gọi X là biến ngẫu nhiên cho chiều cao của BST. Chứng minh rằng kỳ 
vọng E[x] — O(lgn). 

1 . 26 . Cho BST tạo thành từ n khóa được chèn vào theo một trật tự ngẫu nhiên, 
gọi Gọi X là biến ngẫu nhiên cho độ sâu của một nút. Chứng minh rằng kỳ 
vọng E[x] — O(lgn). 

1 . 27 . Gọi b(ji ) là số lượng các cây nhị phân tìm kiếm chứa n khóa hoàn toàn 
phân biệt. 

• Chứng minh rằng ỏ(0) = 1 và b(n) = £k=ẳ b k b n _!_ k 
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• Chứng minh rằng b(n ) = —ỉ-Ị-( 2 ^) (số catalan thứ rì). Từ đó suy ra xác suất 

để BST là cây nhị phân gần hoàn chỉnh (hoặc cây nhị phân suy biến) nếu n 
khóa đuợc chèn vào theo thứ tự ngẫu nhiên. 

• Chứng minh công thức xấp xỉ b(jì) — ^-^ 3/2 (l + 0(l/n)) 

6. Cây nhị phân tìm kiếm ngẫu nhiên 

6.1. Độ cao trung bình của BST 

Trong bài truớc ta đã biết rằng các thao tác co bản của BST đuợc thực hiện 
trong thời gian O(h) với h là chiều cao của cây. Neu n khóa đuợc chèn vào một 
BST rồng, ta sẽ đuợc một BST gồm n nút. Chiều cao của BST có thể là một số 
nguyên nào đó nằm trong phạm vi từ [lgn\ tới n — 1. Neu thay đổi thứ tự chèn n 
khóa vào cây, ta có thế thu đuợc một cấu trúc BST khác. 

Điều chúng ta muốn biết là nếu chèn n khóa vào BST theo các trật tự khác nhau 
thì độ cao trung bình của BST thu đuợc là bao nhiêu. Hay nói chính xác hon, 
chúng ta cần biết giá trị kỳ vọng của độ cao một BST khi chèn n khóa vào theo 
một trật tự ngẫu nhiên. 

Thực ra trong các thao tác CO' bản của BST, độ sâu trung bình của các nút mới là 
yếu tố quyết định hiệu suất chứ không phải độ cao của cây. Độ sâu của nút i 
chính là số phép so sánh cần thực hiện để chèn nút i vào BST. Tổng số phép so 
sánh để chèn toàn bộ n nút vào BST có thế đánh giá tưong tự nhu QuickSort, 

bằng o(nlgn). Vậy độ sâu trung bình của mỗi nút là -O(nlgn) = o(lgn). 

Nguời ta còn chứng minh đuợc một kết quả mạnh hon: Độ cao trung bình của 
BST là một đại luợng o(lgn). Cụ thể là E[h] < 3 lgn + 0(1) với E[h] là giá trị 
kỳ vọng của độ cao và n là số nút trong BST. Chứng minh này khá phức tạp, 
bạn có thể tham khảo trong các tài liệu khác . 
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6.2. Treap 

Chúng ta có thế tránh trường hợp suy biến của BST bằng cách chèn các nút vào 
cây theo một trật tự ngẫu nhiên*. Tuy nhiên trên thực tế rất ít khi chúng ta đảm 
bảo được các nút được chèn/xóa trên BST theo trật tự ngẫu nhiên, bởi các thao 
tác trên BST thường do một tiến trình khác thực hiện và thứ tự chèn/xóa hoàn 
toàn do tiến trình đó quyết định. 

Trong mục này chúng ta quan tâm tới một dạng BST mà cấu trúc của nó không 
phụ thuộc vào thứ tự chèn/xóa: Treap. 

Cho mỗi nút của BST thêm một thông tin priority gọi là “độ ưu tiên”. Độ ưu 
tiên của mỗi nút là một số dưong. Khi đó Treap' [33] được định nghĩa là một 
BST thỏa mãn tính chất của Heap. Cụ thể là: 

• Neu nút y nằm trong nhánh con trái của nút X thì y. key < X. key. 

• Neu nút y nằm trong nhánh con phải của nút X thì y. key > X. key. 

• Nếu nút y là hậu duệ của nút X thì y. priority < X. priority 

Hai tính chất đầu tiên là tính chất của BST, tính chất thứ ba là tính chất của 

Heap. Nút gốc của Treap có độ ưu tiên lớn nhất. Đe tiện trong cài đặt, ta quy 
định nút giả nilT A có độ ưu tiên bằng 0. 

Định lý 6-1 

Xét một tập các nút, mồi nút chứa khóa và độ ưu tiên, khi đó tồn tại cấu trúc 
Treap chứa các nút trên. 

Chứng minh 

Khởi tạo một BST rỗng và chèn lần lượt các nút vào BST theo thứ tự từ nút ưu 
tiên cao nhất tới nút ưu tiên thấp nhất. Hai ràng buộc đầu tiên được thỏa mãn vì ta 
sử dụng phép chèn của BST. Hơn nữa phép chèn của BST luôn chèn nút mới vào 
thành nút lá nên sau mỗi bước chèn, nút lá mới chèn vào không thê mang độ ưu 
tiên lớn hơn các nút tiền bối của nó được. Điều này chi ra rằng BST tạo thành là 
một Treap. 


Tù “tránh” ở đây không chính xác, trên thực tế phương pháp này không tránh được trường hợp xấu. Có 
điều là xác suất xảy ra trường hợp xấu quá nhỏ và rất khó đế “cố tình” chỉ ra cụ thế trường hợp xấu (giống 
như Randomized QuickSort). 

1 Tên gọi Treap là ghép của hai tù: “tree” và “Hcap” 
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Định lý 6-2 

Xét một tập các nút, mồi nút chứa khóa và độ ưu tiên. Neu các khóa cũng như 
độ ưu tiên của các nút hoàn toàn phân biệt thì tồn tại duy nhất cấu trúc Treap 
chứa các nút trên. 

Chứng minh 

Sự tồn tại của cấu trúc Treap đã được chì ra trong chứng minh trong Định lí 6.1. 
Tính duy nhất của cấu trúc Treap này có thế chứng minh bằng quy nạp: Rõ ràng 
định lý đúng với tập gồm 0 nút (Treap rỗng). Xét tập gồm > 1 nút, khi đó nút có 
độ ưu tiên lớn nhất chắc chắn sẽ phải là gốc Treap, những nút mang khóa nhỏ hơn 
khóa của nút gốc phải nằm trong nhánh con trái và những nút mang khóa lớn hơn 
khóa của nút gốc phải nằm trong nhánh con phải. Sự duy nhất về cấu trúc của 
nhánh con trái và nhánh con phải được suy ra từ giả thiết quy nạp. ĐPCM. 

Trong cài đặt thông thường của Treap, độ ưu tiên priority của mỗi nút thường 
được gán bằng một số ngẫu nhiên để vô hiệu hóa những tiến trình “cố tình” làm 
cây suy biến: Cho dù các nút được chèn/xóa trên Treap theo thứ tự nào, cấu trúc 
của Treap sẽ luôn giống như khi chúng ta chèn các nút còn lại vào theo thứ tự 
giảm dần của Priority (tức là thứ tự ngẫu nhiên). Hon nữa nếu biết trước được 
tập các nút sẽ chèn vào Treap, ta còn có thể gán độ ưu tiên priority cho các nút 
một cách hợp lý để “ép” Treap thành cây nhị phân gần hoàn chỉnh (trung vị của 
tập các khóa sê được gán độ ưu tiên cao nhất đế trở thành gốc cây, tưong tự với 
nhánh trái và nhánh phải...). Ngoài ra nếu biết trước tần suất truy cập nút ta có 
thế gán độ ưu tiên của mỗi nút bằng tần suất này đế các nút bị truy cập thường 
xuyên sẽ ở gần gốc cây, đạt tốc độ truy cập nhanh hon. 

6.3. Các thao tác trên Treap 
a) Cấu trúc nút 

Tưong tự như BST, câu trúc nút của Treap chỉ có thêm một trường priority đê 
lưu độ ưu tiên của nút 

type 

PNode = '■'TNode; //Kiểu con trỏ tởi một nút 

TNode = record 
key: TKeỵ; 

parent, left, right: PNode; 
priority: Integer; 
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end; 

var 

sentinel: TNode; 

nilT : PNode ; //Con trỏ tới nút đặt biệt 

r o o t: PNo de; //Con trỏ tói nút gốc 

begin 

sentinel.priority := 0; 
nilT := @sentinel; 

end. 

Trên lý thuyết người ta thường cho các giá trị Priority là số thực ngẫu nhiên, 
khi cài đặt ta có thể cho Priority số nguyên dưong lấy ngẫu nhiên trong một 
phạm vi đủ rộng. Ký hiệu RP là hàm trả về một số dưong ngẫu nhiên, bạn có thể 
cài đặt hàm này bằng bất kỳ một thuật toán tạo số ngẫu nhiên nào. Ví dụ: 

function RP: Integer; 

begin 

Result := 1 + Random(Maxlnt - 1); 

//Lấy ngẫu nhiên từ 1 tới Maxlnt - 1 

end; 

Các phép khởi tạo cây rồng, tìm phần tử lớn nhất, nhỏ nhất, tìm phần tử liền 
trước, liền sau trên Treap không khác gì so với trên BST thông thường. Phép 
quay không được thực hiện tùy tiện trên Treap vì nó sẽ phá võ ràng buộc thứ tự 
Heap, thay vào đó chỉ có thao tác UpTree được nhúng vào trong mỗi phép chèn 
(Insert) và xóa (Delete) đế hiệu chỉnh cấu trúc Treap. 

Nhắc lại về thao tác ơpTree(x) 
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Hình 1.24. Thao tác UpTree(x) 


procedure UpTree 

X: PNode); 

var y, z, branch: 

PNode; 

begin 


ỵ := X A .parent; 

//y A là nút cha cửa JC A 

z := ỵ A .parent; 

/% A là nút cha củay A 

if X = y A .left 

then //Quay phải 

begin 


branch := X 

A .right ; 

SetLink(y, 

branch, True) ; 

SetLink(x, 

y, False); 

end 


else //Quay trái 


begin 


branch := X 

A . 1 e f t ; 

SetLink(ỵ, 

branch, False) ; 

SetLink(x, 

y, True ); 

end; 
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SetLink ( z , X, Z A .left = y) ; //Móc nối X* vào làm con i'' thay choy* 
if root = y then root := x; 

//Cập nhật lại gốc BST nếu trước đâty A /à gốc 

end; 

b) Chèn 

Phép chèn trên Treap trước hết thực hiện như phép chèn trên BST đế chèn khóa 
vào một nút lá. Nút lá X A mới chèn vào sẽ được gán một độ ưu tiên ngẫu nhiên. 
Tiếp theo là phép hiệu chỉnh Treap: Gọi y A là nút cha củax A , chừng nào thấy 
X A mang độ ưu tiên lớn hon y A (vi phạm thứ tự Heap) ta thực hiện lệnh 
ơpTree(x) đê đây nút X A lên làm cha nút y A và kéo nút y A xuông làm con nút 

X A . 

//Chèn khóa k vào Treap, trả về con trỏ tới nút chứa k 

function Insert(k: TKeỵ): PNode; 
var X, ỵ: PNode; 

begin 

//Thực hiện phép chèn như trên BST 
ỵ := nilT; 

X := root; 
while X + nilT do 
begin 
y : = X; 

if k < x A .keỵ then X := x A .left 
else X := x A .right; 
end; 

New(x); 

X A .keỵ := k; 
x A .left := nilT; 

X A .right := nilT; 

SetLink(y, X, k < y A .key); 
if root = nilT then root := x; 

//Chỉnh Treap 

X A . prioritỵ : = RP; //Gán độ UĨI tiên ngẫu nhiên 

repeat 

y := X A .parent; 
if (y + nilT) 

and (x A .prioritỵ > y A .priority) then UpTree(x) 
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else Break; 
until False; 

Result := x; 

end; 

Ví dụ chúng ta có một Treap chứa các khóa A, B, E, G, H, K với độ ưu tiên là 
A:l, B:5, E:2, G:7, H:4, K:3 và chèn một nút khóa chứa khóa I và độ ưu tiên 6 
vào Treap, trước hết thuật toán chèn trên BST được thực hiện như trong hình 
1.25. 



Hình 1.15. Phép chèn trên Treap trước hết thực hiện như trong BST 

Tiếp theo là hai phép UpTree đế chuyển nút 1:6 về vị trí đúng trên Treap 
(h.1.26) 



Hình 1.26. Sau phép chèn BST là các phép UpTree đế chỉnh lại Treap 

SỐ phép UpTree cần thực hiện phụ thuộc vị trí và độ ưu tiên của nút mới chèn 
vào (Có thế là số nào đó từ 0 tới h với h là độ cao của Treap), nhưng người ta đã 
chứng minh được định lý sau: 

Định lý 6.3 

Trung bình số phép UpTree cần thực hiện trong phép chèn Insert là 2. 
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c) Xóa 

Phép xóa nút X A trên Treap được thực hiện như sau: 

• Neu X A có ít hơn hai nhánh con, ta lấy nút con (nếu có) của X A lên thay cho 
X A và xóa nút X A . 

• Neu X A có đúng hai nhánh con, gọi y A là nút con mang độ ưu tiên lớn hơn 
trong hai nút con, thực hiện phép UpTree(y ) để kéo nút X A xuống sâu phía 
dưới lá và lặp lại cho tới khi X A chỉ còn một nút con. Việc xóa quy về 
trường hợp trên 

procedure Delete(x: PNode); 
var ỵ, z: PNode; 

begin 

while (x A .left y nilT) and (x A .right Ỷ nilT) do 

//Chùng nào X A có 2 nút con 

begin 

//Xác định y A là nút con mang độ ưu tiên lớn hơn 

ỵ : = X . 1 e f t ; 

if y A .priority < X A .right A .priority then 
y := x A .right; 

UpTree(y) ; //Đấy y lên phía gốc, kéo X xuống phía lá 

end; 

//Rây giờ X A chỉ có tối đa một nút con, xác định y A là nút con (nếu có) của X 

if x A .left <> nilT then y := x A .left 
else y := x A .right; 
z := X A .parent; //z A là nút cha của X A 

SetLink ( z , y, Z A .left = x) ; //Cho y A làm con của Z A thay cho X A 
if X = root then root := y; //Cập nhật lại gốc 
Dispose ( X) ; //Giảiphóng bộ nhớ 

end; 

Ví dụ chúng ta có một Treap chứa các khóa A, B, E, G, H, I, K với độ ưu tiên là 
A:l, B:5, E:2, G:7, H:4, 1:6, K:3 và xóa nút chứa khóa G. Ba phép UpTree 
(quay) sẽ được thực hiện trước khi xóa nút chứa khóa G 
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Tương tự như phép chèn, số phép UpTree cần thực hiện phụ thuộc vị trí và độ 
ưu tiên của nút bị xóa, nhưng người ta đã chứng minh được định lý sau đây. 

Định lý 6-4 

Trung bình số phép UpTree cần thực hiện trong phép xóa Delete là 2. 


Bài tập 

1 . 28 . Thứ tự thống kê: Cho một Treap, hãy xây dựng thuật toán tìm khóa đứng 
thứ p khi sắp thứ tự. Ngược lại cho một nút, hãy tìm số thứ tự của nút đó 
khi duyệt Treap theo thứ tự giữa. 

1 . 29 . Treap biểu diễn tập hợp 

Khi dùng Treap T biểu diễn tập hợp các giá trị khóa, (tức là các khóa trong 
Treap hoàn toàn phân biệt), phép thử k G T có thể được thực hiện thông 
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qua hàm Search. Việc thêm một phần tử vào tập họp có thế thực hiện 
thông qua một sửa đổi của hàm Insert (Chỉ chèn nếu khóa chua có trong 
Treap). Việc xóa một phần tử khỏi tập họp cũng đuợc thực hiện thông qua 
việc sửa đổi thủ tục Delete (tìm phần tử trong Treap, nếu tìm thấy thì thực 
hiện phép xóa). Ngoài ra còn có nhiều thao tác khác đuợc thực hiện rất 
hiệu quả với cấu trúc Treap, hãy cài đặt các thao tác sau đây trên Treap: 

Phép tách (Split): Với một giá trị k 0 , tách các khóa < k 0 và các khóa 
> k 0 ra hai Treap biểu diễn hai tập hợp riêng rẽ. 

Gợi ỷ: Tìm nút chứa phần tử k 0 trong Treap, nếu không thấy thì chèn k 0 
vào một nút mới. Đặt độ ưu tiên của nút này bằng + 00 . Theo nguyên lý 
của cấu trúc Treap, nút này sẽ được đấy lên thành gốc cây. Ngoài ra theo 
nguyên lý của cấu trúc BST, nhánh con trái của gốc cây sẽ chứa tất cả các 
khóa < k 0 và nhánh con phải của gốc cây sẽ chứa tất cả các khóa > k 0 . 

Phép họp (Union): Cho hai Treap chứa hai tập khóa, xây dựng Treap mới 
chứa tất cả các khóa của hai Treap ban đầu 

Phép giao (Intersection): Cho hai Treap chứa hai tập khóa, xây dựng 
Treap mới chứa tất cả các khóa có mặt trong cả hai Treap ban đầu 

Phép lấy hiệu (Difference): Cho hai Treap A, B chứa hai tập khóa, xây 
dựng Treap mới chứa các khóa thuộc A nhưng không thuộc B. 

7 . Một số ứng dụng của cây nhị phân tìm kiếm 

Ngoài ứng dụng đế biếu diễn tập hợp (Bài tập 6.2), cây nhị phân tìm kiếm còn 
có nhiều ứng dụng quan trọng khác nữa. Trong bài này chúng ta sẽ khảo sát một 
vài ứng dụng khác của cấu trúc BST. 

Cấu trúc BST thông thường có thế dùng đế cài đặt chuông trình giải quyết 
những vấn đề trong bài, tuy nhiên bạn nên sử dụng một dạng BST tự cân bằng 
hoặc Treap đế tránh trường hợp xấu của BST. 

7.1. Cây biếu diễn danh sách 

Chúng ta đã biết những cách co bản đế biếu diễn danh sách là sử dụng mảng 
hoặc danh sách móc nối. Sử dụng mảng có tốc độ tốt với phép truy cập ngẫu 
nhiên nhưng sẽ bị chậm nếu danh sách luôn bị biến động bởi các phép chèn/xóa. 
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Trong khi đó, sử dụng danh sách móc nối có thế thuận tiện hơn trong các phép 
chèn/xóa thì lại gặp nhược điếm trong phép truy cập ngẫu nhiên. 

Trong mục này chúng ta sẽ trình bày một phương pháp biếu diễn danh sách bằng 
cây nhị phân mà các trên đó, phép truy cập ngẫu nhiên, chèn, xóa đều được thực 
hiện trong thời gian o(lgn). Ta sẽ phát biểu một bài toán cụ thể và cài đặt 
chương trình giải bài toán đó. 

a) Bài toán 

Cho một danh sách L đế chứa các số nguyên. Ký hiệu LengthỢS) là số phần tử 
trong danh sách. Xét các thao tác căn bản trên danh sách: 

• Phép chèn Insertiy, í): Nếu 1 < i < Length(L ) + 1, thao tác này chèn một 
số V vào vị trí i của danh sách, nếu không thao tác này không có hiệu lực. 
(Trường hợp i = Length(L) + 1 thì Value sẽ được thêm vào cuối danh 
sách). 

• Phép xóa Deleteự)-. Nếu 1 < i < Length(L), thao tác này xóa phần tử thứ 
i trong danh sách, nếu không thao tác này không có hiệu lực. 

Cho danh sách L — 0 và n thao tác thuộc một trong hai loại, hãy in ra các phần 
tử theo đúng thứ tự trong danh sách cuối cùng. 

Input 

• Dòng 1 chứa số nguyên dương n < 10 5 

• n dòng tiếp, mỗi dòng cho thông tin về một thao tác. Mồi dòng bắt đầu bởi 
một ký tự G {/, D}. Nếu ký tự đầu dòng là “I” thì tiếp theo là hai số nguyên 
V, i tương ứng với phép chèn ỉnsertiy, í), nếu ký tự đầu dòng là D thì tiếp 
theo là số nguyên i tương ứng với phép xóa Deleteự ). Các giá trị V, i là số 
nguyên Integer. 

Output 

Các phần tử trong danh sách cuối cùng theo đúng thứ tự. 
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Sample Input 

Sample Output 

8 

9 16 5 

15 1 


16 1 


17 1 


18 3 


112 


D 4 


19 2 


D 1 



b) Giải thuật và tổ chức dữ liệu 

Chúng ta sẽ lưu trữ các phần tử của danh sách L trong một cấu trúc Treap sao 
cho nếu duyệt Treap theo thứ tự giữa thì các phần tử của L sẽ được liệt kê theo 
đúng thứ tự trong danh sách. 

□ Nút cầm canh cuối danh sách 

Độ ưu tiên của các nút là một số nguyên dưong ngẫu nhiên nhỏ hon hằng số 
Maxlnt. Đe tiện cài đặt, ta thêm vào danh sách L một phần tử giả đứng cuối 
danh sách và gán độ ưu tiên Maxlnt để phần tử này trở thành nút gốc của Treap. 
Phần tử giả này có hai công dụng: 

• Mọi phép chèn hiệu lực đều có một phần tử của danh sách nằm tại vị trí 
chèn, ta bớt đi được các phép xử lý trường hợp riêng khi chèn vào cuối danh 
sách. 

• Nút gốc root A của Treap không bao giờ bị thay đổi, ta không cần phải kiếm 
tra và cập nhật lại gốc sau các phép chèn hoặc xóa. 

Theo cách xây dựng Treap như vậy, toàn bộ các phần tử của danh sách L sẽ nằm 
trong nhánh con trái của nút gốc Treap. Ta chỉ cần duyệt nhánh con trái của nút 
gốc Treap theo thứ tự giữa là liệt kê được tất cả các phần tử theo đúng thứ tự. 

□ Quản lý số nút 

Trong mỗi nút r A của Treap, ta lưu trữ r A . size là số lượng nút nằm trong nhánh 
Treap gốc r A . Trường size của các nút sẽ được cập nhật mỗi khi có sự thay đối 
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cấu trúc Treap. Công dụng của trường size là đế quản lý số nút trong một nhánh 
Treap, phục vụ cho phép truy cập ngẫu nhiên. 

□ Truy cập ngẫu nhiên 

Cả hai phép chèn và xóa đều có một tham số vị trí i. Việc chèn/xóa trên danh 
sách trừu tượng L sẽ quy về việc chèn/xóa trên Treap sao cho duy trì được sự 
thống nhất giữa Treap và danh sách L như đã định. Vậy việc đầu tiên chính là 
xác định nút tưong ứng với vị trí i là nút nào trong Treap. Theo nguyên lý của 
phép duyệt cây theo thứ tự giữa (duyệt nhánh trái, duyệt nút gốc, sau đó duyệt 
nhánh phải), thuật toán xác định nút tưoưg ứng với vị trí i có thế diễn tả như 
sau: Xét bài toán tìm nút thứ i trong nhánh Treap gốc r A : 

• Nếu i = r A . left f '.size + 1 thì nút cần tìm chính là nút r. 

• Neu i < r A . Ze/t A . size + 1 thì quy về tìm nút thứ i trong nhánh con trái của 
r. 

• Nếu i > r*.left*.size + 1 thì quy về tìm nút thứ i — r A .left A . size — 1 
trong nhánh con phải của r A . 

Số bước lặp đế tìm nút tưong ứng với vị trí i có thế tính bằng độ sâu của nút kết 
quả (cộng thêm 1). Phép truy cập ngẫu nhiên được cài đặt bằng hàm NodeAt(i ): 
Nhận vào một số nguyên i và trả về nút tưong ứng với vị trí đó trên Treap. 

□ Chèn 

Đe chèn một giá trị V vào vị trí i, trước hết ta tạo nút X A chứa giá trị V, xác định 
nút y A là nút hiện đang đứng thứ i. Neu y A không có nhánh trái thì móc nối X A 
vào thành nút con trái của y A . Neu không ta đi sang nhánh trái của y A và móc 
nối X A vào thành nút cực phải của nhánh trái này. 

Tiếp theo là phải cập nhật số nút, nút X A chèn vào sẽ trở thành nút lá và có 
X A . size — 1, trường size trong tất cả các nút tiền bối của X A cũng được tăng lên 
1 để giữ tính đồng bộ. 

Cuối cùng, ta gán cho x^.priority một độ ưu tiên ngẫu nhiên và thực hiện các 
phép ơpTree(x) đế đẩy X A lên vị trí đúng. Chú ý là trong phép UpTree, ngoài 
những thao tác xử lý co bản trên Treap, ta phải cập nhật lại trường size của hai 
nút chịu ảnh hưởng qua phép quay. 
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□ Xóa 


Đe xóa phần tử tại vị trí i, ta xác định nút X A nằm tại vị trí i và tiến hành xóa nút 
X A . Phép xóa được thực hiện như trên Treap: Chừng nào X A còn hai nút con, ta 
xác định y A là nút con mang độ ưu tiên lớn hon và thực hiện UpTree(y ) để kéo 
X A sâu xuống dưới lá. Khi X A còn ít hon hai nút con, ta đưa nhánh con gốc y A 
(nếu có) của X A vào thế chỗ và xóa nút X A . Sau khi xóa thì toàn bộ trường Size 
trong các nút tiền bối của X A phải giảm đi 1 đế giữ tính đồng bộ. 

c) Cài đặt 


H 

DYNLIST.PAS K Cây biểu diễn danh sách 


{$MODE OBJFPC} 
program DynamicList; 

type 

PNode = / 'TNode; //Kiểu con trỏ tới một nút 

TNode = record //Kiểu nút Treap 
value: Integer; 
priority: Integer; 
size: Integer; 
left, right, parent: PNode; 
end; 

var 

sentinel: TNode ; //Lính canh (= nilT A ) 
nilT, root: PNode; 
n: Integer; //số thao tác 

functĩon NewNode : PNode; //Hàm tạo nút mới, trả về con trỏ tới nút mới 

begin 

New (Result) ; //cấp phát bộ nhớ 

with Result / ' do //Khởi tạo các trường trong nút mới tạo ra 

begin 

priority := Random(Maxlnt - 1) + 1; 

//Gán độ ưu tiên ngẫu nhiên 
s i z e : = 1; //Nút đứng đon độc, size = 1 
parent := nilT; 
left := nilT; 

right : = nilT; //Các trường liên kết được gán = nil T 

end; 
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end; 

procedure InitTreap; //Khởitạo Treap 

begin 

sentinel.prioritỵ := 0; 
sentinel.size := 0; 

nilT := @sentinel; //Đem con trỏ nilT trỏ tới sentinel 
root := NewNode; 

root / ' .prioritỵ := Maxlnt; //root'' được gán độ ưu tiên cực đại 

end; 

//Móc nối ChildNode thành con của ParentNode 

procedure SetLink(ParentNode, ChildNode: PNode; 

InLeft: Boolean); 

begin 

ChildNode A .parent := ParentNode; 

if InLeft then ParentNode A .left := ChildNode 

else ParentNode A .right := ChildNode; 

end; 

íunction NodeAt(i: Integer) : PNode; //Truy cập ngẫu nhiên 

begin 

Result : = root; //Bắt đầu từ gốc Treap 

repeat 

if i = Result A .left A .size + 1 then Break; 

//Nếu nút này đứng thứ i thì dừng 

if i <= Resul t A . lef t A . si ze then //Lặp lại, tìm trong nhánh con trái 
Result := Result A .left 

else //Lặp lại, tìm trong nhánh con phải 

begin 

Dec(i, Result A .left A .size + 1); 

Result := Result A .right; 

end; 

until False; 
end; 

procedure UpTree(x: PNode) ; //Đẩy X A lên phía gốc Treap bằng phép quay 
var y, z, branch: PNode; 

begin 

ỵ := X A .parent; 
z := ỵ A .parent; 
if X = y A .left then //Quayphải 
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begin 

branch := x A .right; 

SetLink(ỵ, branch, True); 

SetLink(x, y, False); 

end 

else //Quay trái 

begin 

branch := x A .left; 

SetLink(ỵ, branch, False); 

SetLink(x, y, True); 

end; 

SetLink(z, X, z A .left = y) ; 

//Căn thận, phải cập nhật y A .size trước khi cập nhật x A .size 
with ỵ A do size := left A .size + right A .size + 1; 
with X A do size := left A .size + right A .size + 1; 

end; 

procedure Insert (v, i: Integer) ; //Chèn 
var X, ỵ: PNode; 

begin 

if (i < 1) or (i > root A .size) then Exit; 

//Phép chèn vô hiệu, bỏ qua 

X := NewNode; 

X A . value := v; //Tạo nút X A chứa value 
y := NodeAt (i ) ; //Xác định nút y A cần chèn X A vào trước 
if y A .left = nilT then SetLink(y, X, True) 

//y A không có nhánh trái, cho X A làm nhánh trái 

else 

begin 

ỵ := ỵ A . lef t; //Đi sang nhánh trái 

while y A .right <> nilT do y := ỵ A .right; 

//Tới nút cực phải 

SetLink (y, X, False) ; //Móc noi X A vào làm nút cực phải 

end; 

//y = x A .parent, cập nhật trường size của các nút từy lên gốc 

Víhile y <> nilT do 
begin 

Inc(y A .size); 

Y • = y*• parent; 

end; 
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//Chỉnh Treap bằng phép UpTree 

Víhile x A .prioritỵ > X A .parent A .priority do 

//Chùng nào X A ưu tiên hon nút cha 

UpTree (x) ; //Đẩy X A lên phía gốc 

end; 

procedure Delete(i: Integer) ; //Xóa 
var X, ỵ, z: PNode; 

begin 

if (i < 1) or (i >= root A .size) then Exit; 

//Phép xóa vô hiệu, bỏ qua 

X := NodeAt (i) ; //Xác định nút cần xóa X A 

Víhile (x A .left <> nilT) and (x A .right <> nilT) do 
//x A có hai nút con 

begin //Xác định y A là nút con mang độ un tiên lớn hơn 

if X A .left A .priority > X A .right A .prioritỵ then 
y := x A .left 
else y := x A .right; 

UpTree (y) ; //Kéo X A xuống sâu phía dưới lá 

end; 

//x A chỉ còn tối đa 1 nút con, xác định y A là nút con nếu có của X A 

if x A .left <> nilT then y := x A .left 
else ỵ := x A .right; 
z := X A .parent; //z A là cha của X A 

SetLínk(z, y, Z A .left = x) ; //Cho y A vào làm con Z A thay cho X A 
Dispose (X) ; //Giảiphóng bộ nhớ 

while z <> nilT do //Cập nhật trường size của các nút từ Z A lên gốc 

begin 

Dec (z A .size); 
z := z A .parent; 

end; 

end; 

procedure ReadOperators; 

//Đọc dữ liệu, gặp thao tác nào thực hiện ngay thao tác đó 

var 

k, V, i: Integer; 
op: AnsiChar; 

begin 

ReadLn(n); 

for k := 1 to n do 
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begin 

Read(op); 

case op of 
'I': begin 

ReadLn(V, i); 

Insert(V, i); 

end; 

'D': begin 

ReadLn(i); 

Delete(i); 

end; 

end; 

end; 

end; 

procedure PrintResult; //In kết quả 

procedure InOrderTraversal (x : PNode) ; //Duyệt cây theo thứ tự giữa 

begin 

if X = nilT then Exit; 

InOrderTraversal (x A . left) ; //Duyệtnhánh trái 
Write (x A . value, ' '); //In ra giả trị trong nút 

InOrderTraversal (x A .right) ; //Duyệt nhánh phải 
Dispose (x) ; //Duyệt xong thì giãi phóng bộ nhớ luôn 

end; 

begin 

InOrderTraversal(root A .left); 

//Toàn bộ danh sách trừu tượng L nằm trong nhánh trái của gốc 
Dispose (root) ; //Giải phóng luôn nút gốc 
WrìteLn; 
end; 
begin 

InitTreap; 

ReadOperators ; 

PrintResult ; 
end. 
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c) Hoán vị Josephus 

□ Bài toán tìm hoán vị Josephus 

Bài toán lấy tên của Flavius Josephus, một sử gia Do Thái vào thế kỷ thứ nhất. 
Tương truyền rằng Josephus và 40 chiến sĩ bị người La Mã bao vây trong một 
hang động. Họ quyết định tự vẫn chứ không chịu bị bắt. 41 chiến sĩ đứng thành 
vòng tròn và bắt đầu đếm theo một chiều vòng tròn, cứ người nào đếm đến 3 thì 
phải tự vẫn và người kế tiếp bắt đầu đếm lại từ 1. Josephus không muốn chết và 
đã chọn được một vị trí mà ông ta cũng với một người nữa là hai người sống sót 
cuối cùng theo luật này. Hai người sống sót sau đó đã đầu hàng và gia nhập quân 
La Mã (Josephus sau đó chỉ nói rằng đó là sự may mắn, hay “bàn tay của Chúa” 
mới giúp ông và người kia sống sót). 

Có rất nhiều truyền thuyết và tên gọi khác nhau về bài toán Josephus, trong toán 
học người ta phát biểu bài toán dưới dạng một trò chơi: Cho n người đứng 
quanh vòng tròn theo chiều kim đồng hồ đánh số từ 1 tới n. Họ bắt đầu đếm từ 
người thứ nhất theo chiều kim đồng hồ, người nào đếm đến m thì bị loại khỏi 
vòng và người kế tiếp bắt đầu đếm lại từ 1. Trò chơi tiếp diễn cho tới khi vòng 
tròn không còn lại người nào. Neu ta xếp số hiệu của n người theo thứ tự họ bị 
loại khỏi vòng thì sẽ được một hoán vị (J 1 ,j 2 > — 'in ) của dãy số (1,2,... , rì) gọi là 
hoán vị Josephus (n,m). Ví dụ với n — 7, m — 3, hoán vị Josephus sẽ là 
(3,6,2,7,5,1,4). Bài toán đặt ra là cho trước hai số n,m hãy xác định hoán vị 
losephus (n, m). 

□ Thuật toán 

Bài toán tìm hoán vị losephus ( n,m ) có thế giải quyết dễ dàng nếu sử dụng 
danh sách động (Mục 0); Danh sách được xây dựng có n phần tử tương ứng với 
n người. Việc xác định người sẽ phải ra khỏi vòng sau đó xóa người đó khỏi 
danh sách đơn giản chỉ là phép truy cập ngẫu nhiên và xóa một phần tử khỏi 
danh sách động. 

Nhận xét: Neu sau một lượt nào đó, người vừa bị loại là người thứ p và danh 
sách còn lại k người. Khi đó người kế tiếp bị loại là người đứng thứ: (p + m — 
2) mod k + 1 trong danh sách. 


87 


Tuy bài toán khá đơn giản nhưng liên quan tới một kỳ thuật cài đặt quan trọng 
nên ta sẽ cài đặt cụ thế chương trình tìm hoán vị Josephus ( n , m). 

Input 

Hai số nguyên dương n,m < 10 5 

Output 

Hoán vị Josephus (n, m) 


Sample Input 

Sample Output 

7 3 

3 6 2 7 5 1 4 


Xây dựng danh sách gồm n phần tử, ban đầu các phần tử đều chưa đánh dấu 
(chưa bị xóa). Thuật toán sẽ tiến hành n bước, mỗi bước sẽ đánh dấu một phần 
tử tương ứng với một người bị loại. 

Có thể quan sát rằng nếu biểu diễn danh sách này bằng cây nhị phân gồm n nút, 
thì chúng ta chỉ cần cài đặt hai thao tác: 

• Truy cập ngẫu nhiên: Nhận vào một số thứ tự p và trả về nút đứng thứ p 
trong số các nút chưa đánh dấu (theo thứ tự giữa) 

• Đánh dấu: Đánh dấu một nút tương ứng với một người bị loại 

Vậy có thể biểu diễn danh sách bằng một cây nhị phân gần hoàn chỉnh dựng 
sẵn. Cụ thể là chúng ta tổ chức dữ liệu trong các mảng sau: 

• Mảng Tree[ 1 ...n] đế biểu diễn cây nhị phân gồm n nút có gốc là nút 1, ta 
quy định nút thứ i có nút con trái là 2 i và nút con phải là 2i + 1, nút cha của 
nút j là nút L//2J. Cây này ban đầu sẽ được duyệt theo thứ tự giữa và các 
phần tử 1,2, ...,n sẽ được điền lần lượt vào cây (mảng Tree ) theo thứ tự 
giữa. 

• Mảng Marked[ 1 ...n] để đánh dấu, trong đó Markedịi] — True nếu nút 
thứ i đã bị đánh dấu, ban đầu mảng Markedị 1 ...n] được khởi tạo bằng 
toàn giá trị False. 

• Mảng Size[l ...n] trong đó Size[i ] là số nút chưa bị đánh dấu trong nhánh 
cây gốc i. Mảng Size[l ...n] cũng được khởi tạo ngay trong quá trình dựng 
cây. 
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Phép truy cập ngẫu nhiên - nhận vào một số thứ tự p và trả về chỉ số nút đứng 
thứ p chua bị đánh dấu theo thứ tự giữa - sẽ đuợc thực hiện nhu sau: Bắt đầu từ 
nút gốc X = 1, gọi LeftSize là số nút chua đánh dấu trong cây con trái của X. 
Neu nút X chua bị đánh dấu và p = LeftSize + 1 thì trả về ngay nút X và dừng 
ngay, nếu không thì quá trình tìm kiếm sẽ tiếp tục trên cây con trái (p < 
LeftSize ) hoặc cây con phải của X (p > LeftSize). 

Phép đánh dấu một nút X chỉ đon thuần gán Markedịx] ■— True, sau đó đi 
nguợc từ X lên gốc cây, đi qua nút y nào thì giảm Size[y] đi 1 để giữ tính đồng 
bộ. 

□ Cài đặt 


H 

JOSEPHUS.PAS c Tìm hoán vị Josephus 


{$MODE OBJFPC} 

program ơosephusPermutation; 
const max = 100000; 

var 

n, m: Integer; 

tree: array[1..max] of Integer; 

Marked: array[1..max] of Boolean; 
size: array[1..max] of Integer; 

procedure Bui ldTree ; //Dụng sẵn cây nhị phân gần hoàn chỉnh gằm n nút 

var Person: Integer; 

procedure InOrderTraversal(Node: Integer); 

//Duyệt cây theo thứ tự giữa 

begln 

if Node > n then Exit; 

InOrderTraversal (Node * 2); //Duyệt nhánh trái 

Inc(Person); 

tree [Node ] := Person; //Điền phần tử kế tiếp vào nút 

InOrderTraversal (Node * 2 + 1) ; //Duyệt nhánh phải 
//Xây dụng xong nhánh trái và nhánh phải thì bắt đầu tính trường size 

size[Node] := 1; 

if Node * 2 <= n then 

Inc(size[Node], size[Node * 2]); 

if Node * 2 + 1 <= n then 

Inc(size[Node], size[Node * 2 + 1]); 
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end; 

begin 

Person := 0; 

InOrderTraversal (1); 

FillChar(Marked, SizeOf(Marked), False); 

//Tất cả các nút đểu chưa đánh dấu 

end; 

//Truy cập ngẫu nhiên, nhận vào số thứ tự p, trả về nút đúng thứ p trong số các nút chua đánh 
dấu 

function NodeAt(p: Integer): Integer; 
var Leftsize: Integer; 

begin 

Result := 1; //Bắt đầu từ gốc 

repeat 

//Tính số nút trong nhánh con trái 

if Result * 2 <= n then 

Leftsize := size[Result * 2] 
else Leftsize := 0; 

if not Marked[Result] and (Leftsize + 1 = p) then 

B r e a k; //Nút Result chính là nút thứp, dùng 
if Leftsize >= p then 

Result := Result * 2 //Tìm tiếp trong nhánh trái 

else 

begin 

Dec(p, Leftsize); 

//Trước hết tinh lại số thứ tự tương úng trong nhánh phải 
if not Marked[Result] then Dec(p); 

Result := Result * 2 + 1; //Tìm tiếp trong nhánh phải 

end; 

until False; 
end; 

procedure SetMark (Node : Integer) ; //Đánh dấu một nút 

begin 

Marked[Node] := True; //Đánh dấu 

while Node > 0 do //Đằng bộ hóa trường size của các nút tiền bối 

begin 

Dec(size[Node]); 

No de := No de div 2; //Đi lên nút cha 

end; 
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end; 

procedure FindJosephusPermutation; 
var Node, p, k: Integer; 

begin 

p := 1; 

f or k := n dovrnto 1 do 
begin //Danh sách có k người 

p := (p + m - 2) mod k + 1; //Xác định số thứ tự cùa người bị loại 
No de := NodeAt (p) ; //Tìm nút chứa người bị loại 
Write (tree [Node] , ' '); //In ra số hiệu người bị loại 

SetMark (Node) ; //Đánh dấu nút tương ứng trên cây 

end; 

end; 

begin 

Readln(n, m); 

BuildTree; 

FindJosephusPermutation; 

WrìteLn; 

end. 


□ Tìm người cuối cùng còn lại * 

Một bài toán khác liên quan tới bài toán Josephus là cho trước hai số nguyên 
dưong n,m, hãy tìm người cuối cùng bị loại. Ta có thế sử dụng thuật toán tìm 
hoán vị Josephus và in ra phần tử cuối cùng trong hoán vị. Tuy nhiên có thuật 
toán quy hoạch động hiệu quả hon đế tìm người cuối cùng bị loại. Thuật toán 
dựa trên công thức truy hồi sau: 


/(„) = í 1 ' nếu n = 1 . 

l(f(n — 1) — 1 + m) mod n + 1, nêu n > 1 


(7.1) 


Trong đó /(n) là chỉ số người bị loại cuối cùng trong trò choi với trò choi gồm 
n người. Công thức truy hồi (7.2) có thể giải trong thời gian 0(n) bằng một 
đoạn chưong trình đon giản. 


Input - 

-» n, m; 


f := 1; 



for i : 

= 2 to n 

do 

f : = 

(f - 1 + 

m) mod i + 1; 
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Output <— f; 

7.2. Thứ tự thống kê động 

Nhắc lại: Bài toán thứ tự thống kê: Cho một tập s gồm n đối tượng, mỗi đối 
tượng có một khóa sắp xếp. Hãy cho biết nếu sắp xếp n đối tượng theo thứ tự 
tăng dần của khóa thì đối tượng thứ k là đối tượng nào?. 

Chúng ta đã biết thuật toán tìm thứ tự thống kê trong thời gian O(n). Tuy nhiên 
trong trường hợp tập s liên tục có những sự thay đối phần tử (thêm vào hay bớt 
đi một đối tượng), đồng thời có rất nhiều truy vấn về thứ tự thống kê đi kèm với 
những sự thay đổi đó thì thuật toán này tỏ ra không hiệu quả. Chúng ta cần có 
phưong pháp tốt hon đối với bài toán thứ tự thống kê động (Dynamic Order 
Statistics). 

Cây tìm kiếm nhị phân là một cách đế giải quyết hiệu quả vấn đề này. Chúng ta 
lưu trữ các đối tượng của s trong một BST, mỗi nút chứa một đối tượng với 
khóa so sánh chính là khóa của đối tượng chứa trong. 

Mồi đối tượng i được gắn với một con trỏ ptr[i] tới nút tưong ứng trên BST, 
con trỏ này được cập nhật mỗi khi có phép thêm/bớt đối tượng. Tại mỗi nút ta 
duy trì số nút trong nhánh con đó bằng trường size, trường này được cập nhật 
mỗi khi cấu trúc BST bị thay đối (chèn/xóa/quay). Khi đó phép thêm và bớt đối 
tượng được thực hiện tự nhiên bằng phép chèn và xóa trên BST (O(lgn). Dựa 
vào trường size mỗi nút, mồi truy vấn về thứ tự thống kê được trả lời trong thời 
gian o(lgn) (Xem lại mục 0 về cách sử dụng trường Size ). 

7.3. Interval tree 

Cây chứa khoảng (Interval tree) là một cấu trúc dữ liệu để lưu trữ một tập các 
khoảng trên trục số. 

Có ba loại khoảng trên trục số: khoảng đóng (closed interval), khoảng mở (open 
interval) và khoảng nửa mở. 

[5, /] = (x G R: s < X < /} 

(s, f) — {x E R: s < X < /} 

[s,f) — {x e R: s < X < /} 

(s, /] = (x G E: s < X < /} 
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Khoảng đóng còn có tên gọi là đoạn. Ớ những vấn đề trong phần này chúng ta 
quan tâm tới khoảng đóng, nếu muốn làm việc với khoảng mở hoặc khoảng nửa 
mở cần có một số sửa đổi nhỏ. Chúng ta quy định thêm là với một khoảng đóng 
[s,/] bất kỳ thì s < /. 

Định lý 7-1 

Với hai đoạn i x = [s 1 ,f 1 ] và i 2 — [s 2 ,f 2 ], đúng một trong ba mệnh đề dưới đây 
thỏa mãn (interval trichotomy): 

• í, và i 2 gối nhau (overlap), tức là hai đoạn i x và i 2 có điếm chung 

• i t nằm bên trái i 2 : /1 < s 2 

• i t nằm bên phải i 2 : /2 < Si 

Interval tree bản chất là một BST, mỗi nút chứa một đoạn và khóa so sánh là đầu 
mút trái của mỗi đoạn. Tức là nếu duyệt cây theo thứ tự giữa ta sẽ liệt kê được 
tất cả các đoạn theo thứ tự tăng dần của đầu mút trái. 

Tại mỗi nút X, ta lưu trừ thêm một trường righmost : Giá trị lớn nhất của các 
đầu mút phải của các đoạn nằm trong nhánh cây gốc X. Nút giả nilT A có trường 
rightmost — — 00 . Hình 1.28 là ví dụ về cây chứa 10 đoạn: 

[16,21]; [8,9]; [25,30]; [5,8]; [15,23]; [17,19]; [26,26]; [0,3]; [6,10]; [19,20] 



Hình 1.28. Interval tree 


Cấu trúc nút của Interval tree có thế đặc tả như sau: 


type 


PNode = 

A TNode; 

TNode = 

record 

s, f: 

Re a 1 ; //s: đầu mút trái, f: đầu mút phải 
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rightmost: Real; //Thông tin phụ trợ 
parent, left, right: PNode; 

end; 

var 

sentinel: TNode; 
nilT, root: PNode; 

begin 

sentinel. rightmost := 
nilT := @sentinel; 
root := nilT; 

end. 

Trường rightmost của mỗi nút X A được tính theo công thức truy hồi: 


x A .rightmost •■= max 


X A . left A .rightmost 

X A ./ 

x A .right A .rightmost 


(7.2) 


Khi một nút X A được chèn vào thành một nút lá hay bị xóa khỏi BST, tất cả các 
trường rightmost trong X A và các nút tiền bối của X A phải được cập nhật lại. 
Neu bạn cài đặt Interval tree bằng Treap hay một dạng cây nhị phân tìm kiếm tự 
cân bằng, cần chú ý cập nhật lại trường rightmost sau phép quay cây 
( UpTree ). 


a) Tìm đoạn có giao với một đoạn cho trước 

Bài toán đặt ra là cho một tập s gồm n đoạn. Cho một đoạn [a, b], hãy chỉ ra 
một đoạn của s có giao với (hay gối lên) đoạn [ a, b ]. Một dạng truy vấn cụ thế 
hon là hãy chỉ ra một đoạn của s chứa một điếm X cho trước. Bài toán này có 
thể quy về bài toán tổng quát với [ a, b] — [x, x] 

Dĩ nhiên ta có thể trả lời truy vấn này trong thời gian O(n): Duyệt tất cả các 
đoạn của s và sử dụng hàm Overlapped dưới đây đế tìm cũng như liệt kê các 
đoạn gối lên đoạn it. Hàm Overlapped nhận vào 2 đoạn [s 1 ,f 1 ], [s 2 , / 2 ] và trả 
về giá trị True nếu hai đoạn gối nhau: 

function Overlapped(sl, fl, s2, f2: Real): Boolean; 

begin 

Result := (sl ^ f2) and (s2 < fl); 
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end; 

Tuy vậy nếu tập s liên tục có sự biến động (thêm/bớt) các đoạn thì phuơng pháp 
này tỏ ra không hiệu quả. Sử dụng Interval tree cho phép thực hiện thêm/bớt 
đoạn và trả lời truy vấn này hiệu quả hon. 

Xây dựng Interval tree chứa tất cả các đoạn của tập s. Bắt đầu từ nút X A = 
root A , nếu đoạn trong X A có giao với [a, b] thì xong. Nguợc lại, nếu 
X A . Ze/t A . rightmost > a, ta quy về tìm trong nhánh con trái của X A , nếu không 
ta quy về tìm trong nhánh con phải của X A : 

//Trả về nút chứa đoạn giao với [a, b], trả về nilT nếu không thấy 

function IntervalSearch (a, b: Real) : PNode; 

begin 

Result := root; //Bắt đầu từ gốc 
vrhile (Result Ỷ nilT) and 

not Overlapped(Result^.s, Result^.f, a, b) do 
//Result chứa đoạn không giao với [a, bj 
if (Result A . lef t A . rightmost ầ. a) then 
Result := Result A .left //Sang trái 
else Result := Result A .right; //Sangphải 

end; 

Tính đúng đắn của thuật toán đuợc chỉ ra trong hai nhận xét sau: 

• Neu x A .left A .rightmost > a thì chỉ cần tìm trong nhánh con trái của X A 
là đủ, bởi nếu tìm trong nhánh con trái của X A không thấy thì chắc chắn tìm 
trong nhánh con phải cũng thất bại. 

• Nấu x A .left A .rightmost < a thì nhánh con trái của X A chắc chắn không 
chứa đoạn nào có giao với [a, b]. 

Thời gian thực hiện giải thuật IntervalSearch là O(h) với h là chiều cao của 
Interval tree. Các phép thêm/bớt đoạn trong tập s đuợc xử lý nhu trên BST, sau 
đó cập nhật các trường rightmost, cũng có thời gian thực hiện 0(/i) (= O(lgn) 
nếu sử dụng một dạng BST tự cân bằng). 

b) Tìm đoạn đầu tiên có giao với một đoạn cho trước 

Trong một số trường hợp chúng ta cần tìm nút đầu tiên trên Interval tree (theo 
thứ tự giữa) chứa đoạn có giao với đoạn [a, b]. Điều này được thực hiện dựa trên 
một hàm đệ quy FirstlntervalSearch như sau: 
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//Tìm đoạn đầu tiên giao với [a, b] trong nhánh cây gốc X A 

function FirstIntervalSearch(x: PNode; 

a, b: Real): PNode; 

begin 

Result := nilT; 

if X = nilT then Exit; //Nhánh rỗng thì trả về nilT 
if X A .left A .rì ghtmo s t d a then //Nếu có thì phải có trong nhảnh trải 
Result := FirstIntervalSearch (x A .left, a, b) ; 
else //Nhánh trái chắc chắn không có 

if Overlapped(x A .s, x A .f, a, b) then 
//Đoạn trong X A có giao với [a, b] 

Result := X 

else //Nếu có thì chỉ có trong nhánh phải 

Result := FirstIntervalSearch(x A .right, a, b); 

end; 

c) Liệt kê các đoạn có giao với một đoạn cho trước 

Bài toán đặt ra là cho tập s gồm n đoạn, hãy liệt kê các đoạn có giao với đoạn 
[a,b] cho trước. Dĩ nhiên chúng ta có thể duyệt tất cả các đoạn của s và dùng 
hàm Overlapped để liệt kê các đoạn thỏa mãn trong thời gian 0(n), trên thực tế 
không có thuật toán nào tốt hon trong trường hợp xấu nhất: Tất cả các đoạn của 
s đều có giao với [a,b]. 

Tuy nhiên chúng ta có thế tìm một thuật toán khác mà thời gian thực hiện giải 
thuật phụ thuộc vào số đoạn được liệt kê và ít phụ thuộc vào giá trị của n. 

Trước hết ta xây dựng Interval tree chứa các đoạn của s. Sau đó sử dụng thủ tục 
Listỉntervals(Root, a,b ) đế liệt kê. Thủ tục Listlntervals được cài đặt như 
sau: 

//Liệt kê các đoạn có giao với [a, b] trong nhánh cây gốc X A 

procedure Listlntervals(x: PNode; a, b: Real); 

begin 

if X = nilT then Exit; 

if X A .left A .rí ghtmo s t >= a then //Trong nhánh con trái có thể có 
Listlnte r va ls (x A .left) ; //Liệt kê trong nhánh con trái 
if Overlapped (x A . s, x A .f, a, b) then //Đoạn chứa trong X A có giao 
Output <— [x A .s, x A .f]; //Liệt kê 
if X A .S <= b then //Trong nhánh con phải có thế có 
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Listlnte r va 1 s (X A . r ight ) ; //Liệt kê trong nhánh con phải 

end; 

Thời gian thực hiện giải thuật là 0(lgn + rrì) với m là số nút được liệt kê 
7.4. Tóm tắt về kỹ thuật cài đặt 

Còn rất nhiều ứng dụng khác liên quan tới cấu trúc cây nhị phân, nhưng chỉ với 
một số ứng dụng kể trên, ta có thế thấy rằng cây nhị phân là một cấu trúc dữ liệu 
tốt đế biếu diễn danh sách: Bằng cơ chế đánh số nút theo thứ tự giữa, chúng ta 
có hình ảnh một danh sách với các nút được sắp thứ tự, qua đó có thế cài đặt các 
phép chèn/xóa và truy cập ngẫu nhiên rất hiệu quả. 

Tại sao lại là thứ tự giữa mà không phải thứ tự trước hay thứ tự sau? Mặc dù các 
thao tác cơ bản này vẫn có thế cài đặt nếu các nút của cây được đánh số theo thứ 
tự trước (hoặc sau), nhưng chúng ta sẽ gặp phải khó khăn khi thực hiện thao tác 
cân bằng cây. Hiện tại hầu hết các kỳ thuật cân bằng cây nhị phân (trên cây 
AVL, cây đỏ đen, cây Splay hay Treap) đều dựa vào phép quay, mà phép quay 
thì không bảo toàn thứ tự trước và thứ tự sau của các nút. Nếu như chúng ta 
không cần sử dụng phép quay (như bài toán tìm hoán vị Josephus) thì hoàn toàn 
có thế đánh số các nút trên cây theo thứ tự trước hoặc thứ tự sau. 

Một chú ý quan trọng nữa là cơ chế lưu trữ và đồng bộ hóa thông tin phụ trợ. 
Thông thường đối với các bài toán sử dụng cây nhị phân, mỗi nút sẽ có chứa 
một thông tin đế hỗ trợ quá trình tìm kiếm trên cây (tại mỗi bước thì đi tiếp sang 
nhánh trái hay nhánh phải). Như ở ví dụ cây biểu diễn danh sách chúng ta sử 
dụng trường size chứa số nút trong một nhánh cây, hay ở ví dụ Interval tree, 
chúng ta sử dụng trường rightmost để chứa đầu mút phải lớn nhất của một 
đoạn nằm trong nhảnh cây. Thông tin phụ trợ sẽ được cập nhật mồi khi có sự 
thay đổi cấu trúc để giữ tính đồng bộ. Có hai nguyên lý chọn thông tin phụ trợ: 
Thứ nhất, thông tin phụ trợ ở mỗi nút phải là thông tin tống hợp từ tất cả các 
nút trong nhánh đó, thứ hai, tuy là sự tổng hợp thông tin từ tất cả các nút trong 
nhánh nhưng thông tin phụ trợ có thể tính được chỉ bằng thông tin ở gốc 
nhánh và hai nút con. 

Những ràng buộc như vậy đảm bảo cho quá trình đồng bộ thông tin phụ trợ 
không làm tăng cấp phức tạp của thời gian thực hiện giải thuật. Việc thay đối 
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thông tin phụ trợ ở một nút chỉ kéo theo việc cập nhật lại thông tin phụ trợ ở 
những nút tiền bối mà thôi*. 

Chú ý cuối cùng là nếu nhu biết trước cây nhị phân sẽ chỉ chứa các phần tử 
trong một tập hữu hạn s, đồng thời có cách nào đó tránh không phải cài đặt phép 
chèn và xóa thì có thế dựng sẵn một cây nhị phân gần hoàn chỉnh gồm |s| nút. 
Khi đó chúng ta loại bỏ được các con trỏ liên kết và không cần thực hiện các 
phép cân bằng cây - hai thứ dễ gây nhầm lẫn nhất trong việc cài đặt cây nhị 
phân. 

Ta xét một ví dụ cuối cùng trước khi kết thúc bài. 

7.5. Điểm giao nhiều nhất 
a) Trường họp một chiều 

Bài toán tìm điểm giao nhiều nhất (point of Maximum Overlap - POM) (một 
chiều) phát biểu như sau: Cho n khoảng đóng trên trục số, khoảng đóng thứ i là 
[Sj,/j] (Sị < fi), hãy tìm một điếm trên trực số thuộc nhiều khoảng nhất trong số 
n khoảng đã cho. 

Thuật toán đế giải quyết bài toán POM một chiều khá đon giản: Với một khoảng 
đóng [Sị,fi\, ta gọi Si là đầu mút mở và fi là đầu mút đóng, sắp xếp 2 n đầu mút 
của các khoảng đã cho từ trái qua phải (từ nhỏ đến lớn), nếu nhiều đầu mút ở 
cùng tọa độ thì tất cả đầu mút mở tại vị trí đó được xếp các đầu mút đóng. Khởi 
tạo một biến đếm bằng 0 và duyệt các đầu mút theo thứ tự đã sắp xếp, gặp đầu 
mút mở thì biến đếm tăng 1 còn gặp đầu mút đóng thì biến đếm giảm 1. Quá 
trình kết thúc, biến đếm trở lại thảnh 0, noi biến đếm đạt cực đại chính là điểm 
cần tìm. Giá trị cực đại của bộ đếm đạt được chính là số khoảng đóng phủ qua 
điểm đó. 

Tuy vậy, thuật toán trên không thực sự hiệu quả nếu tập các khoảng đóng liên 
tục biến động đi kèm với những truy vấn về POM. Chúng ta cần xây dựng cấu 


Có những bài toán cụ thế sử dụng cây nhị phân mà thông tin phụ trợ không tuân theo hai nguyên lý này, 
nhung cần đến một cơ chế đồng bộ hóa đặc biệt. 
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trúc dữ liệu đế hồ trợ các phép thêm/bớt khoảng và trả lời các truy vấn về điếm 
giao nhiều nhất hiệu quả hon. 

Giải pháp là ta luu trữ các đầu mút trong một BST sao cho nếu duyệt BST theo 
thứ tự giữa thì ta sẽ đuợc thứ tự sắp xếp nói trên (đầu mút nhỏ hon xếp truớc và 
đầu mút mở đuợc xếp trước đầu mút đóng nếu ở cùng vị trí trên trục số). 

Thông tin phụ trợ thứ nhất trong mồi nút X A là nhãn sign. Ở đây X A . sign = +1 
nếu nút chứa đầu mút mở và X A . sign = — 1 nếu nút chứa đầu mút đóng. 

Thông tin phụ trợ thứ hai trong mỗi nút X A là trường sum: Tổng của tất cả các 
nhãn trong các nút nằm trong nhánh cây gốc X A . Trường sum được tính theo 
công thức: 

x A .sum ■■= X A . Ze/t A . sum + x A .sign + x A .right*.sum (7.3) 

Thông tin phụ trợ thứ ba trong mỗi nút X A là trường maxsum: Cho biết nếu ta 
duyệt nhánh cây gốc X A theo thứ tự giữa và cộng dồn lần lượt các trường sign ở 
mỗi nút thì giá trị lớn nhất đạt được trong quá trình cộng là bao nhiêu. Trường 
maxsum được tính theo công thức: 

X A . maxsum 



(7.4) 


x A .Left A .sum + x A .sign + x A .right A .maxsum 


Công thức truy hồi (7.3) khá dề hiểu, ta sẽ phân tích tính đúng đắn của công 
thức truy hồi (7.4). Rõ ràng trong quá trình cộng dồn các trường sign ở mỗi nút 
vào một biến đếm, giá trị cực đại của biến đếm này có thế bằng: 

• Giá trị lóư nhất đạt được khi cộng xong nhánh con trái, khi đó 
x A .maxsum — x A .left A maxsum. 

• Giá trị đạt được khi cộng tới nút X A , khi đó 
x A .maxsum — X A . left A .sum + x A .sign 

• Giá trị đạt được khi cộng tới một nút nào đó ở nhánh con phải, khi đó 
x^.maxsum — X A . left A .sum + x A .sign + x A .right A .maxsum 

Vậy ta có thể lấy giá trị lớn nhất trong ba khả năng này để gán cho X A . maxsum. 
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Đe tiện hơn trong việc trả lời truy vấn POM, tại mỗi nút ta lưu trữ một trường 
POM chứa điếm mà tại đó quá trình cộng dồn các trường sign đạt cực đại (bằng 
maxsum). Phép cập nhật POM được thực hiện song song với quá trình tính 
maxsum: Tùy theo maxsum đạt tại nhánh trái, chính nút X A hay nhánh phải, ta 
sẽ cập nhật lại trường POM của X A . 

Có thể nhận thấy rằng trường sum và maxsum tuy là thông tin tống hợp từ tất 
cả các nút trong một nhánh, nhưng có thể tính được chỉ dựa vào thông tin trong 
nút gốc và hai nút con. Tức là ta có thể duy trì và đồng bộ thông tin phụ trợ 
trong mỗi nút sau mỗi phép chèn/xóa mà không làm tăng cấp phức tạp của thời 
gian thực hiện giải thuật. 

Vậy thì nếu n là số nút trên BST, 

• Chèn một đoạn [s, /] vào tập trừu tượng các khoảng đóng tương ứng với 
chèn một đầu mút s với sign — 1 vào BST và chèn một đầu mút / với 
sign = — 1 vào BST. Thời gian o(lgn). 

• Xóa một đoạn [s, /] tương ứng với xóa đi đầu mút s và đầu mút / khỏi 
BST. Thời gian o(lgn). 

• Trả lời truy vấn POM, chỉ cần truy xuất root A . POM. Thời gian 0(1). 

b) Trường hợp hai chiều 

Bài toán tìm điểm giao nhiều nhất (hai chiều) được phát biểu như sau: Cho n 
hình chữ nhật đánh số từ 1 tới n trong mặt phang trực giao Oxy. Các hình chữ 
nhật có cạnh song song với các trục tọa độ. Mỗi hình chữ nhật được cho bởi 4 
tọa độ x 1 ,y 1 ,x 2 ,y 2 trong đó (Xi,yi) là tọa độ góc trái dưới và (x 2 ,y 2 ) là tọa độ 
góc phải trên (x x < x 2 ,y 1 < y 2 ). Hãy tìm một điếm trên mặt phang thuộc nhiều 
hình chữ nhật nhất trong số các hình chữ nhật đã cho (điếm nằm trên cạnh một 
hình chữ nhật vẫn tính là thuộc hình chữ nhật đó). 

Bài toán POM hai chiều là một trong những ví dụ hay về kỳ thuật cài đặt, chúng 
ta sẽ viết chương trình đầy đủ giải bài toán POM hai chiều với khuôn dạng 
Input/Output như sau. 

Input 

• Dòng 1 chứa số nguyên dương n < 10 6 . 


100 


• n dòng tiếp theo, dòng thứ i chứa 4 số nguyên dương x 1 ,y 1 ,x 2 ,y 2 - (— 10 9 < 
X 1 < x 2 < 10 9 ; — 10 9 < y 1 < y 2 < 10 9 ). 

Output 

Điểm giao nhiều nhất và số hình chữ nhật chứa điếm giao nhiều nhất. 


Sample Input 

Sample Output 

4 

13 5 7 

3 16 4 

4 2 8 5 

6 5 8 7 

point of Maximum Overlap: (4, 3) 

Number of Rectangles: 3 



□ Biến đổi tọa độ 

Mồi hình chữ nhật tương ứng với hai cạnh ngang (cạnh đáy và cạnh đỉnh) và hai 
cạnh dọc (cạnh trái và cạnh phải). Như vậy có tất cả 2 n cạnh ngang và 2 n cạnh 
dọc. Sắp xếp hai dãy tọa độ này theo quy tắc sau: 

• Dãy 2 n cạnh dọc được xếp theo thứ tự tăng dần theo hoành độ (trái qua 
phải), nếu nhiều cạnh dọc ở cùng hoành độ thì những cạnh trái được xếp 
trước những cạnh phải. 

• Dãy 2 n cạnh ngang được xếp theo thứ tự tăng dần theo tung độ (dưới lên 
trên), nếu nhiều cạnh ngang ở cùng tung độ thì những cạnh đáy được xếp 
trước những cạnh đỉnh. 
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Sau đó ta ánh xạ hoành độ mỗi cạnh ngang cũng như tung độ mỗi cạnh dọc 
thành chỉ số của nó trong hai dãy đã sắp xếp. 

Tọa độ những hình chữ nhật ban đầu sẽ bị biến đổi qua ánh xạ này, tuy nhiên ta 
có thể tìm POM trong tập các hình chữ nhật mới và ánh xạ ngược tọa độ POM 
thành tọa độ ban đầu. Ví dụ: 



Hình 1.19. Phép ánh xạ tọa độ 

Phép biến đổi này có những công dụng: 

• Tất cả các hoành độ của cạnh dọc cũng như tất cả các tung độ của cạnh 
ngang trở thảnh 2n số nguyên hoàn toàn phân biệt. 

• Cho dù tọa độ của các hình chữ nhật ban đầu có thế rất lớn, hoặc là số thực, 
qua ánh xạ này chúng ta sẽ chỉ xử lý các tọa độ nguyên 1,2,... ,2n. 

• Tọa độ POM có thể ảnh xạ ngược lại dễ dàng. Bởi khi xác định được điếm 
giao nhiều nhất nằm trên đường ngang thứ mấy và đường dọc thứ mấy, ta có 
thể chiếu vào hai dãy tọa độ ban đầu đế tìm tọa độ trước khi ảnh xạ. 

Bạn có thể thắc mắc rằng POM có thể không nằm trên đường ngang cũng như 
đường dọc nào (như ví dụ trên có thể ta tìm được POM là (3.5,3.5) trên bản đồ 
ánh xạ). Khi đó ta có thế xác định POM nằm giữa hai đường ngang liên tiếp nào 
và nằm giữa hai đường dọc liên tiếp nào, sau đó ánh xạ ngược lại. Tuy nhiên 
không cần phải rắc rối như vậy, thuật toán mà chúng ta sẽ trình bày luôn tìm 
được POM nằm trên giao của một đường ngang và một đường dọc. 
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□ Đường quét ngang 

G điểm giao nhiều nhất có tọa độ ( a , ồ), khi đó nếu ta xét đường thẳng y — b, 
nó sẽ cắt ngang qua một số hình chữ nhật. Giao của các hình chữ nhật với đường 
thắng y — b tạo thành các khoảng đóng trên đường thẳng đó. Khi đó tọa độ a 
chính là điểm giao nhiều nhất của các khoảng đóng (một chiều). 



Ví dụ như với bản đồ trên, ta xét đường thẳng y — 3, nó sẽ cắt ngang qua 3 hình 
chữ nhật tạo thành 3 khoảng đóng: [1,4]; [2,6]; [3,8]. Điếm giao nhiều nhất của 3 
khoảng đóng này là điểm X — 3 (hay bất cứ điểm nào nằm trong đoạn [3,4]). 
Vậy POM tưong ứng có tọa độ (3,3). 

Thuật toán tìm POM hai chiều có thế trình bày như sau: Xét tất cả các đường 
thắng nằm ngang có phưong trình y — b, với mỗi đường đó ta xét các giao với 
các hình chữ nhật đã cho và tìm điếm giao nhiều nhất, ghi nhận lại điếm giao 
nhiều nhất trên tất cả các giá trị b đã thử. 

Chúng ta sẽ phải thử với bao nhiêu đường thắng dạng y — ồ?, có thể nhận thấy 
rằng chỉ cần thử với lần lượt các giá trị b — 1,2,... ,2 n là đủ. 

Rõ ràng với b — 0, tập các khoảng đóng tạo ra trên đường thắng y — 0 là rồng. 
Sau khi xét xong mồi đường thẳng y — b, xét tiếp đến đường thẳng y — b + 1, 
có hai khả năng xảy ra: 

• Nếu đường y — b + 1 là một cạnh đáy của hình chữ nhật (x 1 ,y 1 ,x 2 ,y 2 ) 
(y 1 — b + 1), ta bổ sung [x ± , x 2 ] vào tập các khoảng đóng (thời gian 
o(lgn)) và tìm POM (0(1)). 
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• Neu đường y — b + 1 là một cạnh đỉnh của hình chữ nhật (x 1 ,y 1 ,x 2 ,y 2 ) 
(y 2 — b + 1), ta loại bỏ [x 1 ,x 2 ] khỏi tập các khoảng đóng (thời gian 
O(lgn)). 

□ Dựng sẵn BST 

Nhắc lại trong kỳ thuật cài đặt bài toán tìm POM một chiều, ta sử dụng BST 
chứa các đầu mút của các khoảng đóng. Tuy nhiên do các đầu mút là các số 
nguyên hoàn toàn phân biệt trong phạm vi 1,2,... ,2n, nên ta có thể dựng sẵn cây 
nhị phân chứa 2 n nút, mỗi nút sẽ chứa một đầu mút với nhãn Sign = +1 nếu đó 
là đầu mút mở, Sign = — 1 nếu đó là đầu mút đóng và Sign — 0 đế đánh dấu 
đầu mút đó không có hiệu lực (do khoảng đóng tưong ứng chưa được xét đến 
hoặc đã bị loại bỏ). Có thể thấy rằng cách gán giá trị Sign — 0 này không làm 
ảnh hưởng đến tính đúng đắn của công thức (7.3) và (7.4). 

Cây nhị phân dựng sẵn được biếu diễn bởi một mảng tree[0 ... 2n], mỗi phần tử 
là một bản ghi chứa các trường point: tọa độ điểm, sign: Nhãn đầu mút 
G (—1,0, +1}, sum, maxsum và POM. Ý nghĩa của các trường được giải thích 
như trên. Nút gốc của cây là tree[l]. Nút i có con trái là 2i và con phải là 
2 i + 1. Hai hàm left và right dưới đây trả về nút con trái và con phải của một 
nút, (trả về 0 trong trường hợp nút i không có con trái hoặc con phải) 


function 

valid(x: Integer): 

Boolean; 

begin 



Result 

:= X <= 2 * n; 


end; 

function 

begin 

left(x: Integer): 

Integer; 

if IsNode(x * 2) then Result := X * 2 

else Result := 0; 


end; 

function 

begin 

right(x: Integer): 

Integer; 

if IsNode(x * 2 + 1) then 
else Result := 0; 

Result := X * 2 + 1 

end; 




Vì nếu nút không có con trái (phải) thì hàm left ( right ) trả về 0, ta sẽ gán các 
trường sum và maxsum của tree[0] bằng 0 cho tiện cài đặt. 
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□ Cài đặt 

H POM.PAS c Điểm giao nhiều nhất 


{$MODE OBJFPC} 

program PointOfMaximumOverlap; 
const max = 100000; 

type 

TEndPointType = (eptOpen, eptciose); 

TEndPoint = record //Kiểu đầu mút của khoảng đóng 
value: Integer; //Tọađộ 

ept: TEndPointType; //Loại: đầu mút mở hay đầu mút đỏng 
rid: Integer; //Chỉ số hình chữ nhật tương ủng 

end; 

TRect = record //Kiểu hình chữ nhật 

xl, yl, x2, ỵ2 : Integer; //(xl,yl): Trái Dưới, (x2,y2): Phải Trên 

end; 

TEndPointArray = array[1..2 * max] of TEndPoint; 

//Kiều danh sách các đầu mút 

TNode = record //Thông tin nút của cây nhị phân 
point: Integer; 
sign: Integer; 
sum, maxsum: Integer; 

POM: Integer; 
end; 
var 

X, y: TEndPointArraỵ; 
r: array [1..max] of TRect; 
tree: array[0..2 * max] of TNode; 
ptr: array[1..2 * max] of Integer; 
n, ResX, ResY, m: Integer; 
procedure Enter; //Nhập dữ liệu 
var i, j: Integer; 
begin 

ReadLn(n); 

for i : = 1 to n do //Đọc 2n tọa độ X và 2n tọa độ y 

begin 

j :=2*n+l-i; 

Read(x[i].value); 
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X [i] .Ept 

X[i].rid 
Read(ỵ[i] 

ỵ [i] •Ept 
ỵ [i] .rid 
Read(x[j] 

X [ j] .Ept 
X [ j] .rid 

Read(ỵ[j] 

y [ j] •Ept 
ỵ [ j] •rid 

end; 


= eptOpen; 

= i; 
value); 

= eptOpen; 

= i; 
value); 

= eptciose; 
= i; 
value); 

= eptciose; 
= i; 


end; 

operator < (const p, q: TEndPoint): Boolean; 

//p sẽ được xếp trước q nếu... 

begin 

Result := (p.value < q.value) or 

(p.value = q.value) and (p.Ept < q.Ept); 
//Open < Close 

end; 

procedure Sort(var k: TEndPointArray); 

//Sắp xếp danh sách các đầu mút 

procedure Partition(L, H: Integer); 

var 

i, j : Integer; 

Pivot: TEndPoint; 

begin 

if L >= H then Exit; 
i := L + Random(H - L + 1); 

Pivot := k[i]; 
k[i] := k [ L ] ; 
i : = L; 

j := H; 

repeat 

while (Pivot < k[j]) and (i < j) do Dec(j); 

if i < j then 
begin 

k[i] := k[j]; 

Inc (i) ; 
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end 

else Break; 

while (k[i] < Pivot) and (i < j) do Inc(i); 

if i < j then 
begin 

k[j] := k[i]; 

Dec (j); 

end 

else Break; 
until i = j ; 

k[i] := Pivot; 

Partition(L, i - 1); 

Partition (i + 1, H) ; 

end; 

begin 

Partition(l, 2 * n); 

end; 

procedure RefineRects; //Ảnh xạ tọa độ 
var i: Integer; 

begin 

for i := 1 to 2 * n do 
begin 

with x[i] do 

if ept = eptOpen then r[rid].xl := i 
else r[rid].x2 := i; 
with y[i] do 

if ept = eptOpen then r[rid].yl := i 
else r[rid].y2 := i; 

end; 

end; 

íunction valid(x: Integer) : Boolean; //Nút có họp lệ không 

begin 

Result := X <= 2 * n; 

end; 

function left(x: Integer) : Integer; //Tìm nút con trái của Node 

begin 

if valid(x * 2) then Result := X * 2 //Nút con trái họp lệ 
else Result := 0; //Nếu không trả về 0 
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end; 

function right(x: Integer) : Integer; //Tìm nút con phải của Node 

begin 

if valid(x * 2 + 1) then Result := X * 2 + 1 

//Nút con phải hợp lệ 

else Result := 0; //Nếu không trả về 0 

end; 

procedure BuildTree; //Dựng sẵn BSTgồm 2n nút 

var 

i: Integer; 

procedure InOrderTraversal(x: Integer); 

//Duyệt cây theo thứ tự giữa 

begin 

if not valid(x) then Exit; 

InOrderTraversal (x * 2); 

Inc (i); 

tree [x] . point := i; //Đưa điểm i vào nútNode 
ptr [ i ] : = X; //ptr[i]: Nút chứa điếm tọa độ i trong BST 

InOrderTraversal(x * 2 + 1); 

end; 

begin 

FillByte (tree, SizeOf (tree) , 0); //sum, maxsum := 0 

i := 0; 

InOrderTraversal (1); 

end; 

//target := Max(a, b, c) 

íunction ChooseMax3 (var target: Integer; 

a, b, c: Integer): Integer; 

begin 

target := a; 

Result := 1; //Trả về 1 nếu Max đạt tại a 
if target < b then 
begin 

target := b; 

Result : = 2; //Trả về 2 nếu Max đạt tại b 

end; 

if target < c then 
begin 

target := c; 
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Result := 3; //Trả về 3 nếu Max đạt tại c 

end; 

end; 

//Đặt nhãn sign = s cho nút mang tọa độ p trong BST 

procedure SetPoint(p: Integer; s: Integer); 

var 

Node, L, r, Choice: Integer; 

begin 

No de := ptr[p]; //Xác định nút chứa điểm p 
tree[Node] .sign := s; //Đặt nhăn sign 
repeat //Cập nhật thông tin phụ trợ từ Node lên gấc 1 

L := left(Node); 

r := right (No de) ; //L: Con trái; r: Con phải 
//Tính trường sum 

tree[Node].sum := tree[Node].sign + tree[L].sum 

+ tree[r].sum; 

//Tính trường maxsum 

Choice := ChooseMax3(tree[Node].maxsum, 

tree[L].maxsum, 

tree[L].sum + tree[Node].sign, 
tree[L].sum + tree[Node].sign 
+ tree[r].maxsum); 

case Choice of //Tính POM tùy theo maxsum đạt tại đâu 

1: tree [Node] . POM := tree[L] .POM; //Đạt tại nhánh trái 
2: tree[Node].POM := tree[Node].point; 

//Đạt tại chinh Noile 

3: tree [Node] . POM := tree[r] .POM; //Đạt tại nhánh phải 

end; 

No de := No de div 2; //Đi lên nút cha 
until Node = 0; 
end; 

//Thêm một đoạn [xl, x2] vào tập cần tìm POM 

procedure Insertlnterval(xl, x2: Integer); 

begin 

SetPoint(xl, +1); //Đặt nhãn đầu mút mở là+1 
SetPoint(x2, -1); //Đặt nhãn đầu mút đóng là-1 

end; 

//Loại một đoạn [xl, x2] khởi tập cần tìm POM (đặt nhãn của hai đầu mút thành 0) 

procedure Deletelnterval(xl, x2: Integer); 
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begin 

SetPoint(xl, 0); 

SetPoint (x2 , 0) ; 

end; 

procedure Sweep; //Sử dụng các dòng quét ngang để tìm POM 

var 

sweepY, POM: Integer; 

begin 

BuildTree ; 
m : = 0 ; 

for sweepY := 1 to 2 * n do //Xét các đường quéty = 1,2,2n 

with ỵ[sweepY] do 

if ept = eptOpen then //Quét vào một cạnh đáy 

begin 

Insertlnterval(r[rid].xl, r[rid].x2); 

//Thêm một đoạn vào tập tìm POM 
if tree[l].maxsum > m then 

//POM mới là giao của nhiều hình chữ nhật hon POM cũ 
begin 

m := tree[l].maxsum; 

POM := tree[1].POM; 

//Ánh xạ ngược lại, tìm tọa độ 

ResX := x[POM].value; 

ResY := ỵ[sweepY].value; 

end; 

end 

else //Quét vào một cạnh đỉnh 

Deletelnterval(r[rid].xl, r[rid].x2); 

end; 

procedure PrintResult; 

begin 

WriteLn ( 'Point of Maximum Overlap: 

(', ResX, ', ', ResY, 

WriteLn('Number of Rectangles: m); 

end; 

begin 

Enter; //Nhập dữ liệu 

Sort(x); 
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s o r t (ỵ) ; //sắp xếp hai dãy tọa độ 

Ref ineRects ; //Ánh xạ sang tọa độ mới 

s we ep; //Sử dụng đường quét ngang để tìm POM 

PrintResult; //Inkếtquă 

end. 

Thời gian thực hiện giải thuật tìm điếm giao nhiều nhất của n hình chữ nhật là 
0 (n lgn). 


Bài tập 

1 . 30 . Cho một BST chứa n khóa, và hai khóa a, b. Nguời ta muốn liệt kê tất cả 
các khóa k của BST thỏa mãn a < k < b. Hãy tìm thuật toán 0(m + lgn) 
để trả lời truy vấn này (m là số khóa đuợc liệt kê). 

1 . 31 . Cho n là một số nguyên duong và X — (x 1 ,x 2 , — ,x n ) là một hoán vị của 

dãy số (1,2, Với Vi: 1 < i < n, gọi tj là số phần tử đứng truớc giá 

trị i mà lớn hon i trong dãy X. Khi đó dãy t — (t 1; t 2 ,..., t n ) đuợc gọi là 
dãy nghịch thế của dãy X = (x 1; x 2 ,..., x n ). 

Ví dụ với n — 6, dãy X = (3,2,1,6,4,5) thì dãy nghịch thế của nó là 
t = (2,1,0,1,1,0) 

Xây dựng thuật toán 0(n lg rì) tìm dãy nghịch thế từ dãy hoán vị cho truớc 
và thuật toán 0(n lgn) đế tìm dãy hoán vị từ dãy nghịch thế cho truớc. 

1 . 32 . Trên mặt phang với hệ tọa độ trực giao Oxy cho n hình chữ nhật có cạnh 
song song với các trục tọa độ. Hãy tìm thuật toán o(nlgn) đế tính diện 
tích phần mặt phang bị n hình chữ nhật đó chiếm chồ. 

1 . 33 . Cho n dây cung của một hình tròn, không có hai dây cung nào chung đầu 
mút. Tìm thuật toán 0(n lgn) xác định số cặp dây cung cắt nhau bên trong 
hình tròn. (Ví dụ nếu n dây cung đều là đuờng kính thì số cặp là (”)). 

1 . 35 . Trên trục số cho n đoạn đóng, đoạn thứ i là [< 2 j, bị], (a Ể , bi EN). Hãy chọn 
trên trục số một số ít nhất các điểm nguyên phân biệt sao cho có ít nhất Cj 
điểm đuợc chọn thuộc vào đoạn thứ i. (1 < n < 10 5 ; 0 < dị, bị, Cị < 10 5 ). 
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1 . 36 . Bản đồ một kh u đất hình chữ nhật kích thước m X 71 được chia thành lưới 

ô vuông đơn vị. Trên đó có đánh dấu k ô trồng cây ( m , n,k < 10 5 ). Người 

ta muốn giải phóng một mặt bằng nằm trong khu đất này. Bản đồ mặt bằng 

có các ràng buộc sau: 

• Cạnh mặt bằng là số nguyên 

• Mặt bằng chiếm trọn một số ô trên bản đồ 

• Cạnh mặt bằng song song với cạnh bản đồ 

Hãy trả lời hai câu hỏi: 

• Neu muốn xây dựng mặt bằng với cạnh là D thì phải giải phóng ít nhất bao 
nhiêu ô trồng cây? 

• Neu không muốn giải phóng ô trồng cây nào thì có thế xây dựng được mặt 
bằng với cạnh lớn nhất là bao nhiêu? 

1 . 37 . Một bộ n < 10 5 lá bài được xếp thành tập và mỗi lá bài được ghi số thứ tự 
ban đầu của lá bài đó trong tập bài (vị trí các lá bài được đánh số từ 1 tới n 
từ trên xuống dưới). 

Xét phép tráo ký hiệu bởi 5(i, j): rút ra lá bài thứ i và chèn lên trên lá bài 
thứ i trong số n — 1 lá bài còn lại (1 < i,j < rì), quy ước rằng nếu j = n 
thì lá bài thứ i sẽ được đặt vào vị trí dưới cùng của tập bài. 


Ví dụ với n — 6 

(1, [H 3,4,5,6) ^3 (1,3, \2}, 4,5,6) 

(tu 3,2,4,5, 6) 3^3 (3, [Q 2,4,5, 6) 

(3,1,2, GQ 5,6) 3^3 (3,1,2,5,0,6) 

QH 1,2,5,4,6) —> (l,2,5,4,6,[ 3 ]) 

Người ta tráo bộ bài bằng X phép tráo (x < 10 5 ). Bạn được cho biết X 
phép tráo đó, hãy sử dụng thêm ít nhất các phép tráo nữa đế đưa các lá bài 
về vị trí ban đầu. Như ở ví dụ trên, chúng ta cần sử dụng thêm 2 phép tráo 
5(6,3) và 5(5,4). 
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Chuyên đề 7 


ĐỒ THỊ 


1. Đường đi ngắn nhất 

1.1. Đồ thị có trọng số 

Trong các ứng dụng thực tế, chắng hạn trong mạng lưới giao thông, người ta 
không chỉ quan tâm đến việc tìm đường đi giữa hai địa điếm mà còn phải lựa 
chọn một hành trình tiết kiệm nhất (theo tiêu chuẩn không gian, thời gian hay 
một đại lượng mà chúng ta cần giảm thiếu theo hành trình). Khi đó người ta gán 
cho mỗi cạnh của đồ thị một giá trị phản ánh chi phí đi qua cạnh đó và cố gắng 
tìm một con đường mà tổng chi phí các cạnh đi qua là nhỏ nhất. 

Đồ thị có trọng số là một bộ ba G — ( y , E, w) trong đó G — (y, E ) là một đồ thị, 
w là hàm trọng số: 

w: E —> R 
e I—> w(e) 

Hàm trọng số gán cho mỗi cạnh e của đồ thị một số thực w(e) gọi là trọng số 
(weight) của cạnh. Neu cạnh e — ( u , V ) thì ta cũng ký hiệu w(u, v) — w(e). 

Tưong tự như đồ thị không trọng số, có nhiều cách biếu diễn đồ thị có trọng số 
trong máy tính. Neu ta sử dụng danh sách cạnh, danh sách kề hay danh sách liên 
thuộc, mồi phần tử của danh sách sẽ chứa thêm một thông tin về trọng số của 
cạnh tưong ứng. Trường hợp biểu diễn đon đồ thị gồm n đỉnh, ta còn có thế sử 
dụng ma trận trọng số w — {w uv } nxn trong đó w uv là trọng số của cạnh (lí, V). 
Trong trường hợp (lí, v) ể E thì tùy bài toán cụ thế, w uv sẽ được gán một giá trị 
đặc biệt để nhận biết (lí, v) không phải là cạnh (chẳng hạn có thể gán bằng + 00 , 
0 hay — oo). 

Đường đi, chu trình trong đồ thị có trọng số cũng được định nghĩa giống như 
trong trường hợp không trọng số, chỉ có khác là độ dài đường đi không tính 
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bằng số cạnh đi qua, mà được tính bằng tổng trọng số của các cạnh đi qua. Độ 
dài của một đường đi p được ký hiệu là w(p). 

1.2. Đường đi ngắn nhất xuất phát từ một đỉnh 

Bài toán tìm đường đi ngắn nhất xuất phát từ một đỉnh ( sỉngle-source shortest 
path ) được phát biếu như sau: Cho đồ thị có trọng số G — (V, E, w), hãy tìm các 
đường đi ngắn nhất từ đỉnh xuất phát s G V đến tất cả các đỉnh còn lại của đồ 
thị. Độ dài của đường đi từ đỉnh s tới đỉnh t, ký hiệu Ô(s, t), gọi là khoảng cách 
(distance) từ s đến t. Neu như không tồn tại đường đi từ s tới t thì ta sẽ đặt 
khoảng cách đó bằng + 00 . Có một vài biến đổi khác của bài toán tìm đường đi 
ngắn nhất xuất phát từ một đỉnh: 

• Tìm các con đường ngắn nhất từ mọi đỉnh tới một đỉnh t cho trước. Bằng 
cách đảo chiều các cung của đồ thị, chúng ta có thể quy về bài toán tìm 
đường đi ngắn nhất xuất phát từ t. 

• Tìm đường đi ngắn nhất từ đỉnh s tới đỉnh t cho trước. Dĩ nhiên nếu ta tìm 
được đường đi ngắn nhất từ s tới mọi đỉnh khác thì bài toán tìm đường đi 
ngắn nhất từ s tới t cũng sẽ được giải quyết. Hon nữa, vẫn chưa có một 
thuật toán nào tìm đường đi ngắn nhất từ s tới t mà không cần quy về bài 
toán tìm đường đi ngắn nhất từ s tới mọi đỉnh khác. 

• Tìm đường đi ngắn nhất giữa mọi cặp đỉnh của đồ thị: Mặc dù có những 
thuật toán đon giản và hiệu quả để tìm đường đi ngắn nhất giữa mọi cặp 
đỉnh, chúng ta vẫn có thế giải quyết bằng cách thực hiện thuật toán tìm 
đường đi ngắn nhất xuất phát từ một đỉnh với mọi cách chọn đỉnh xuất phát. 

a) Cấu trúc bài toán con tối ưu 

Các thuật toán tìm đường đi ngắn nhất mà chúng ta sẽ khảo sát đều dựa vào một 
đặc tính chung: Mồi đoạn đường trên đường đi ngắn nhất phải là một đường đi 
ngắn nhất. 

Định lý 1-1 

Cho đồ thị có trọng số G — (V, E, w), gọi p — (rq, Ư 2 , —,v k ) là một đường đi 
ngắn nhất từ V 1 tới v k , khi đó với mọi i,j: 1 < i < j < k, đoạn đường Pịj — 
(v it Vị +1 ,..., Vị) là một đường đi ngắn nhất từ Vị tới Vj. 
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Chúng ta sẽ thấy rằng hầu hết các thuật toán tìm đuờng đi ngắn nhất đều là thuật 
toán quy hoạch động (ví dụ thuật toán Floyd) hoặc tham lam (ví dụ thuật toán 
Dijkstra) bởi tính chất bài toán con tối uu nêu ra trong Định lý 1-1. 

Neu nhu đồ thị có chu trình âm (chu trình với độ dài âm) thì khoảng cách giữa 
một số cặp đỉnh nào đó có thể không xác định, bởi vì bằng cách đi vòng theo 
chu trình này một số lần đủ lớn, ta có thế chỉ ra đuờng đi giữa hai đỉnh nào đó 
trong chu trình này nhỏ hơn bất kỳ một số cho truớc nào. Trong truờng hợp nhu 
vậy, có thế đặt vấn đề tìm đuờng đi đơn ngắn nhất, vấn đề đó lại là một bài toán 
NP-đầy đủ, hiện chua ai chứng minh đuợc sự tồn tại hay không một thuật toán 
đa thức tìm đuờng đi đơn ngắn nhất trên đồ thị có chu trình âm. 

b) Quy về bài toán đo khoảng cách 

Neu nhu đồ thị không có chu trình âm thì có thể chứng minh đuợc rằng một 
trong nhũng đuờng đi ngắn nhất là đuờng đi đơn. Khi đó chỉ cần biết đuợc 
khoảng cách từ s tới tất cả những đỉnh khác thì đuờng đi ngắn nhất từ s tới t có 
thế tìm đuợc một cách dễ dàng qua thuật toán sau: 

Truớc tiên ta tìm đỉnh iq V t đổ ỗ(s, t ) = ỗ(s, Vị) + c(v v t). Dễ thấy rằng luôn 
tồn tại đỉnh nhu vậy và đỉnh đó sẽ là đỉnh đứng liền truớc t trên đuờng đi 
ngắn nhất từ s tới t. Neu Vị — s thì đuờng đi ngắn nhất là đuờng đi trực tiếp 
theo cung (s, t). Neu không thì vấn đề trở thành tìm đuờng đi ngắn nhất từ s tới 
V Ấ . Và ta lại tìm đuợc một đỉnh v 2 Ể (t, rq} để ổ(s, v-i) — S(s,v 2 ) + 
c(v 2 , t)...Cứ tiếp tục nhu vậy sau một số hữu hạn buớc cho tới khi xét tới đỉnh 
v k — s, Ta có dãy t = v 0 ,v 1 ,v 2 , ...v k — s không chứa đỉnh lặp lại. Lật nguợc 
thứ tự dãy cho ta đuờng đi ngắn nhất từ s tới t. 



c) Nhãn khoảng cách và phép co 

Tất cả những thuật toán chúng ta sẽ khảo sát để tìm đuờng đi ngắn nhất xuất 
phát từ một đỉnh đều sử dụng kỹ thuật gán nhãn khoảng cách: Với mỗi đỉnh 
V E V, nhãn khoảng cách d[v ] là độ dài một đuờng đi nào đó từ s tới V. Trong 
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trường hợp chúng ta chưa xác định được đường đi nào từ s tới V, nhẵn d[v] 
được gán giá trị + 00 . 

Ban đầu chúng ta chưa xác định được bất kỳ đường đi nào từ s tới các đỉnh khác 
nên các d [ư] được gán giá trị khởi tạo là: 


d[v] = \°:l ếu lz 1 „ o = 1.2.n) (1.1) 

1+00, nêu V + s 


procedure 

Init; 


begin 



for Vv 

G V do d[v] 

:= +°°; 

d[s] : = 

0; 


end; 




Do tính chất của nhãn khoảng cách, ta có d[v] > ỗ(s, v), Vv E V. Các thuật toán 
tìm đường đi ngắn nhất sẽ cực tiếu hóa dần các nhãn d [. ] cho tới khi d [v] — 
S(s, v), Vv E V. Trong các thuật toán mà chúng ta sẽ khảo sát, việc cực tiểu hóa 
các nhãn khoảng cách được thực hiện bởi các phép co. 

Phép co theo cạnh (lí, v) E E, gọi tắt là phép co (lí, v) được thực hiện như sau: 
Giả sử chúng ta đã xác định được d [lí] là độ dài một đường đi từ s tới li, ta nối 
thêm cạnh (lí, v) đế được một đường đi từ s tới V với độ dài d[u] + w(u,v ). 
Neu đường đi này có độ dài ngắn hon d[v], ta ghi nhận lại d[v] bằng d[u] + 
w(u,v ). Điều này có nghĩa là nếu s u nối thêm cạnh (u,v) lại ngắn hon 
đường đi s V đang có, thì ta hủy bỏ đường đi s V hiện tại và ghi nhận lại 
đường đi s V mới là đường đi s u V. 



Hình 2.1. Phép co 

CÓ thế hình dung hoạt động của phép co như sau: Căng một đoạn dây đàn hồi 
dọc theo đường đi s tới V, đoạn dây sẽ dãn ra tới độ dài d[v]. Tiếp theo ta thử 
lấy đoạn dây đó căng dọc theo đường đi từ s tới u rồi nối tiếp đến V. Neu đoạn 
dây bị chùng xuống (co lại) hon so với cách căng cũ, ta ghi nhận đường đi tưong 
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ứng với cách căng mới, nếu đoạn dây không chùng xuống (hoặc căng thêm) thì 
ta vẫn giữ đoạn dây đó căng theo đuờng cũ. Chính vì phép co không làm “dài” 
thêm d[v], ta nói rằng d[v ] bị cực tiểu hóa qua phép co (lí, V ). 

Phép co (lí, v) được thực hiện bởi hàm Relax, hàm nhận vào cạnh (lí, v) và trả 
về True nếu nhãn d[v] bị giảm đi qua phép co (lí, V ): 

function Relax(e = (u,v)6E) : Boolean; 

begin 

Result := d[v] > d[u] + w(e); 
if Result then 
begin 

d[v] := d [u] + w (e) ; //cựctiểu hóa nhãn d[v] 

trace [v] : = u; //Lun vết đường đi 

end 

end; 

Mồi khi d[v] bị giảm xuống sau phép co (lí, v), ta lưu lại vết traceịv] ■= u với 
ý nghĩa đường đi ngắn nhất từ s tới V cho tới thời điểm được ghi nhận sẽ là 
đường đi qua lí trước rồi đi tiếp theo cung (lí, v), vết này được sử dụng đế truy 
vết tìm đường đi khi thuật toán kết thúc. 

d) Một số tính chất và quy ước 

Các tính chất sau đây tuy đon giản nhưng quan trọng đế chứng minh tính đúng 
đắn của các thuật toán trong bài: 

• Bất đắng thức tam giác (triangle inequality): Với một cạnh (lí, V ) G E, ta có 
8 (s, v) < 8 (s, ù) + w(u, v) . 

• Cận dưới (lower bound) và sự hội tụ (convergence): Các d[v] sau một loạt 
phép co sẽ giảm dần nhưng không bao giờ nhỏ hon khoảng cách ổ(s, v). 
Tức là khi d[v] — 8(s, V) (d[v] đạt cận dưới) thì không một phép co nào 
làm giảm d [v] đi được nữa. 

• Cây đường đi ngắn nhất (shortest-path tree): Neu ta khởi tạo các d[v] và 
thực hiện các phép co cho tới khi d [v] bằng khoảng cách từ s tới V (Vv G 
V) thì chúng ta cũng xây dựng được một cây gốc s trong đó nút V là con của 
nút Traceịv]. Đường đi trên cây từ nút gốc s tới một nút V chính là đường 
đi ngắn nhất. 


117 



• Sự không tồn tại đường đi (no path): Neu không tồn tại đường đi từ 5 tới t 
thì cho dù chúng ta co như thế nào chăng nữa, d[t ] luôn bằng + 00 . 

Đe tiện trong trình bày thuật toán, ta đưa vào một quy ước khi cộng giá trị 00 với 
hằng số c. Bởi trong máy tính không có khái niệm 00 , các chưong trình cài đặt 
thường sử dụng một hằng số đặc biệt đế thay thế, nhưng có thế phải đi kèm với 
vài sửa đổi để hợp lý hóa các phép toán: 

c + (+oo) = (+oo) + c — +00 
c + (—00 ) = (— 00 ) + c — —00 

Dưới đây ta sẽ xét một số thuật toán tìm đường đi ngắn nhất từ đỉnh s tới đỉnh t 
trên đồ thị có hướng G — (y, E ) có n đỉnh và m cung, các đỉnh được đánh số từ 
1 tới n. Trong trường hợp đồ thị vô hướng với trọng số không âm, bài toán tìm 
đường đi ngắn nhất có thể quy dẫn về bài toán tìm đường đi ngắn nhất trên phiên 
bản có hướng của đồ thị. 

Input 

• Dòng 1 chứa số đỉnh n < 10 4 , số cung m < 10 5 của đồ thị, đỉnh xuất phát 
s, đỉnh đích t. 

• m dòng tiếp theo, mỗi dòng có dạng ba số u, V, w, cho biết (lí, v) là một 
cung E E và trọng số của cung đó là w (w là số nguyên có giá trị tuyệt đối 
< 10 5 ) 

Output 

Đường đi ngắn nhất từ s tới t và độ dài đường đi đó. 
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□ Thuật toán 

Thuật toán Bellman-Ford[5][14] có thế sử dụng để tìm đường đi ngắn nhất xuất 
phát từ một đỉnh s G V trong trường họp đồ thị G — (V, E, iv) không có chu 
trình âm. Thuật toán này khá đon giản: Khởi tạo các nhãn khoảng cách 
đ[s] := 0 và d[v] ■— +co,Vv + s, sau đó thực hiện phép co theo mọi cạnh của 
đồ thị. Cứ lặp lại như vậy đến khi không thể cực tiểu hóa thêm bất kỳ một nhãn 
d [v] nào nữa. 

Init; 

repeat 

stop := True; 

for Ve 6 E do 

if Relax(e) then stop := False; 
until stop; 

□ Tính đúng và tính dừng 

Gọi 8 k (s, v) là độ dài ngắn nhất của một đường đi từ s tới V qua đúng k cạnh, 
nếu không tồn tại đường đi từ s tới V qua k cạnh thì ỗ k (s, V ) = + 00 . 

Ta chứng minh rằng sau mồi lần lặp thứ k của vòng lặp repeat.. .until thì 

d[v] < S k (s,v),\/v G V (1.2) 

Tại bước khởi tạo, rõ ràng d[v] — ố 0 (s,v) . Giả sử bất đắng thức (1.2) đúng 
trước lần lặp thứ k, ta chứng minh rằng bất đẳng thức vẫn đúng sau lần lặp thứ 
k. Thật vậy, đường đi ngắn nhất từ s tới V qua k cạnh sẽ phải thành lập bằng 
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cách lấy một đường đi ngắn nhất từ 5 tới một đỉnh u nào đó qua k — 1 cạnh rồi 
đi tiếp tới V bằng cung (u,v): s u -* V. Vì thế ỗ k (s, v) có thế được tính bằng 
công thức truy hồi: 

5 k (s,v) = min {ổfc_iO,w) + w(u,v )} 

UEV 

(u,v)EE 

> rmn {d[u\ + w(u, v)} (1.3) 

( u,v)eE 

> d[v] 

Bất đẳng thức thứ nhất đúng do giả thiết quy nạp và các phép co không bao giờ 
làm tăng d[u]. Bất đẳng thức thứ hai đúng vì sau khi căng theo tất cả các cạnh 
(..., v) thì không thể tồn tại u để d[v] > d[u] + w(it, v) được nữa. 

Trong các đường đi ngắn nhất từ s tới V, sẽ có một đường đi đon (qua không quá 
n — 1 cạnh). Tức là ỗ(s, v) — min /c:1 < /c < íl _ 1 S k (s, v). Sau n— 1 bước lặp của 
vòng lặp repeat...until, ta thu được các d[v] thỏa mãn d[v] < S k (s,v) với mọi 
V E V và mọi số k — 1,2, ...,n — 1. Điều này chỉ ra rằng: d[v] < ổ(s,v), Vu G 
V. Mặt khác d[v] > ổ(s,v) (tính bị chặn dưới), vậy Vv E V: d[v] — ổ(s,v) sau 
n — 1 bước lặp repeat...until, điều này cũng cho thấy thuật toán Bellman-Ford 
sẽ kết thúc sau không quá n — 1 bước lặp repeat.. .until. 

□ Cài đặt 

Cách biếu diễn đồ thị tốt nhất đế cài đặt thuật toán Belhnan-Ford là sử dụng 
danh sách cạnh. Danh sách cạnh của đồ thị được lưu trữ trong mảng e[l ...m], 
mỗi phần tử của mảng là một bản ghi chứa chỉ số hai đỉnh đầu mút u, V và trọng 
số w tưong ứng với một cạnh 


H 

BELLMANFORD.PAS V Thuật toán Bellman-Ford 


{$MODE OBJFPC} 

program BellmanFordShortestPath; 

const 

maxN = 10000; 

maxM = 100000; 

maxW = 100000; 

maxD = maxN * maxW; 

type 
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TEdge = record //cấu trúc biểu diễn cung 
X, y: Integer; //Đỉnh đầu và đỉnh cuối 
w: Integer; //Trọngsố 

end; 

var 

e: array [ 1. .maxM] of TEdge; //Danhsách cung 
d: array [ 1. .maxN] of Integer; //Nhãn trọng số 
trace: array [ 1. .maxN] of Integer; //vết 
n, m, s, t: Integer; 
procedure Enter; //Nhập dữ liệu 
var i: Integer; 
begin 

ReadLn(n, m, s, t); 

for i := 1 to m do 

with e[i] do ReadLn(x, y, w); 

end; 

procedure Init; //Khởi tạo 

var v: Integer; 

begin 

f or V := 1 to n do d [ V ] := MaxD; //Các nhãn d[v] := +00 

d [ s ] : = 0 ; //Ngoại trừ d[s] = 0 

end; 

íunction Relax(const e: TEdge) : Boolean; //Phép co theo cạnh e 
begin 

with e do 
begin 

Result := (d[x] < maxD) and (d[y] > d[x] + w) ; 
if Result then //Co được 
begin 

d [ y ] : = d [ X ] + w; //Cực tiểu hóa nhãn d[v] 

trace [y] := x; //Lưu vết 

end; 

end; 

end; 

procedure BellmanFord; 

var 

stop: Boolean; 
i, CountLoop: Integer; 
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begin 

for CountLoop : = 1 to n - 1 do //Lặp tối đa n -1 lần 
begin 

stop := True; //Chưa có sự thay đối nhãn nào 
for i := 1 to m do 

if Relax(e[i]) then stop := False; 
if stop then Break; //Không nhãn nào thay đổi, dừng 
end; 

end; 

procedure PrintResult; //In kết quả 

begin 

if d[t] = maxD then //d[t] = +C0, không có đường 

WriteLn ( 'There is no path from ', s, ' to t) 

else 

begin 

WriteLn('Distance from ', s, ' to t, 

d [ t ] ) ; 

Víhile t <> s do //Truy vết từ t 
begin 

Write (t, 
t := trace[ t ] ; 

end; 

WriteLn(s); 

end; 

end; 

begin 

Enter; 

Init; 

BellmanFord; 

PrintResult ; 

end. 

Dễ thấy rằng thời gian thực hiện giải thuật Bellman-Ford trên đồ thị G(y,E,w) 
làO(|F||£|). 
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f) Thuật toán Dijkstra 
□ Thuật toán 

Trong trường hợp đồ thị G — (y, E, w) có trọng sổ trên các cung không âm, 

thuật toán do Dijkstra [ 8 ] đề xuất dưới đây hoạt động hiệu quả hon nhiều so với 
thuật toán Bellman-Ford bởi quá trình sửa nhãn sẽ chỉ xét mỗi cạnh tối đa một 
lần. Tại mỗi bước, thuật toán đi tìm đỉnh u mà nhãn đ[it] đã đạt cận dưới bằng 
8(s, lí). Nhãn đ[ií] chắc chắn không thể cực tiểu hóa được nữa, khi đó thuật toán 
mới tiến hành cực tiếu hóa các nhãn d [V ] khác bằng các phép sửa nhãn theo 
cạnh (lí, v). Các bước cụ thể được tiến hành như sau: 

Bước 1: Khởi tạo 

Gọi thủ tục Init đế khởi tạo các nhãn khoảng cách đ[s] := 0 và d[v] ■— 
+ 00 , Vi? + s. Một nhãn d[v] gọi là cố định nếu ta biết chắc d[v] — ổ(s,v) và 
không thế cực tiểu hóa d[v ] thêm nữa bằng phép co, ngược lại nhãn d[v ] gọi là 
tự do. Ta sẽ đánh dấu trạng thái nhãn bằng mảng avail[l..n] trong đó 
avail[v] — True nếu nhãn d[v] còn tự do. Ban đầu tất cả các nhãn đều tự do. 

Bước 2: Lặp, bước lặp gồm có hai thao tác: 

• Cố định nhãn: Chọn trong các đỉnh có nhãn tự do, lấy ra đỉnh u là đỉnh có 
d[u] nhỏ nhất, đánh dấu cố định nhãn đỉnh lí ( availịu ] := False). 

• Sửa nhãn: Dùng đỉnh lí, xét tất cả những đỉnh V nối từ lí và thực hiện phép 
co theo cung (lí, v) đế cực tiểu hóa nhãn d[v]. 

Bước lặp sẽ kết thúc khi mà đỉnh đích t được cố định nhãn (tìm được đường đi 
ngắn nhất từ s tới t); hoặc tại thao tác cố định nhãn, tất cả các đỉnh tự do đều có 
nhãn là +00 (không tồn tại đường đi). 

Tại lần lặp đầu tiên, đỉnh s có đ[s] nhỏ nhất (bằng 0) sẽ được cố định nhãn. Có 
thế đặt câu hỏi tại sao đỉnh lí có nhãn tự do nhỏ nhất được cố định nhãn tại từng 
bước, giả sử d[u] còn có thế làm nhỏ hon nữa thì tất phải có một đỉnh X mang 
nhãn tự do sao cho d[u] > d[x] + w(x,lí). Do trọng số w(x, lí) không âm nên 
d[u] > d[x], trái với cách chọn d[u] nhỏ nhất. 

Bước 3: Truy vết 
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Ket hợp với việc lưu vết đường đi trên từng bước sửa nhãn, thông báo đường đi 
ngắn nhất tìm được hoặc cho biết không tồn tại đường đi. 

□ Cài đặt 

Thuật toán Dijkstra hoạt động tốt nhất nếu đồ thị được biếu diễn bằng danh sách 
kề dạng forward star. cấu trúc danh sách kề được khai báo như sau: 

type 

TAdjNode = record //cấu trúc nút của danh sách kề 
v: Integer; //Đỉnh kề 
w: Integer; //Trọng số cạnh tương ứng 
end; 
var 

adj : array [ 1. .maxM] of TAdjNode; //Mảngcácnút 
head: array [1..maxN] of Integer; 

//head[u]: Chỉ số nút đầu tiên của danh sách kề u 
link: array [1..maxM] of Integer; 

/Aink[i]: Chỉ số nút kế tiếp nút adj[ij trong cùng một danh sách kể 

Mỗi đỉnh u sẽ tưong ứng với một danh sách các nút, mỗi nút chứa một đỉnh V và 
trọng số w của một cung (u,v). Tất cả các nút được lưu trữ trong mảng 
adj[ 1 ...m] và mồi nút sẽ thuộc đúng một danh sách kề. Các nút thuộc danh 
sách kề của đỉnh u là adị\ị^\, adj[i 2 ], adj[i 3 ], trong đó i t — head[u])i 2 — 
linkịi^-, í 3 = link[i 2 ] ... Đây chính là cấu trúc dữ liệu biếu diễn danh sách móc 
nối đon, nhưng khác với những phép cài đặt truyền thống, ta sử dụng mảng các 
nút thay cho co chế cấp phát biến động và sử dụng chỉ số với vai trò như con trỏ. 


H DUKSTRA.PAS ✓ 


{$MODE OBJFPC} 

program DijkstraShortestPath; 

const 

maxN = 10000; 

maxM = 100000; 

maxW = 100000; 

maxD = maxN * maxW; 

type 

TAdjNode = record //cấu trúc nút của danh sách kề 
v: Integer; //Đỉnh kề 
w : Integer; //Trọng số cung tương ứng 
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link: Integer; //Chỉ số nút kế tiếp trong cùng danh sách kề 
end; 
var 

adj : array [ 1. .maxM] of TAdjNode; //Mủng chứa tất cả các nút 
head: array[1..maxN] of Integer; 

//head[u]: Chỉ so nút đứng đầu danh sách kề của u 
d: array [ 0 . .maxN] of Integer; //Nhãn khoảng cách 
avail: array [ 1. .maxN] of Boolean; //Đánh dấu tự do/cố định 
trace: array [ 1. .maxN] of Integer; //vết đường đi 
n, m, s, t: Integer; 
procedure Enter; //Nhập dữ liệu 
var i, u: Integer; 
begin 

ReadLn(n, m, s, t); 

FillChar(head[1], n * SizeOf(head[1]), 0); 

//Khởi tạo các danh sách kề rỗng 

for i := 1 to m do 
begin 

ReadLn(u, adj[i].V, adj[i].w); 

//Đọc một cung (u, v) trọng so w, đưa V và w vào trong nút adj[i] 

adj [i ] . link := head[u]; //Chèn nút adj[i] vào đầu danh sách kề của u 

head [u] := i; //Cập nhật chỉ so nút đứng đầu danh sách kề của u 

end; 

end; 

procedure Init; //Khởi tạo 

var v: Integer; 

begin 

for V := 0 to n do d[v] := MaxD; 

//Các nhãn d[v] := + 00 , d[0]: phần tử cầm canh 
d [ s ] : = 0 ; //Ngoại trừ d[s] = 0 

FillChar(avail[1], n * SizeOf(avail [1]), True) ; 

//Các nhãn đều tự do 
end; 

procedure Relax(u, v: Integer; w: Integer); 

//Phép co theo cung (u, v) trọng so w 

begin 

if d[v] > d[u] + w then 
begin 

d [ V ] : = d [ u ] + w; 
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trace [v] := u; 

end; 

end; 

procedure Dijkstra; //Thuật toán Diịkstra 

var u, V, i: Integer; 

begin 

repeat 

//Tìm đỉnh u có nhãn tự do nhở nhất 

u : = 0 ; 

f or V : = 1 to n do 

if avail[v] and (d[v] < d[u]) then 
u : = V ; 

if (u = 0) or (u = t) then Break; 

//u = 0: không tồn tại đường đi, u = t, xong 

avail [u] := False; //cố định nhãn đỉnh u 

//Co theo các cung nối từ u 

i : = he ad [ u ] ; //Duyệt từ đầu danh sách kề 
while i <> 0 do 
begin 

Relax (u, adj [i] . V, adj [i] . w) ; //Thực hiện phép co 
i := adj [i] . link; //Chuyến sang nút kế tiếp trong danh sách kề 
end; 

until False; 
end; 

procedure PrintResult; //In kết quả 

begin 

if d[t] = maxD then 

WriteLn ( 'There is no path from ', s, ' to t) 

else 

begin 

WriteLn('Distance from ', s, ' to t, 

d [ t ] ) ; 

whỉle t <> s do 
begin 

Write (t, 
t := trace[t]; 

end; 

WriteLn (s); 
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Mỗi lượt của vòng lặp repeat...until sẽ có một đỉnh mang nhãn tự do bị cố định 
nhãn, suy ra số lượt lặp của vòng lặp repeat...until là 0(|L|). Việc tìm đỉnh u có 
nhãn tự do nhỏ nhất được thực hiện trong thời gian 0(|1/|), vậy nên xét trên toàn 
thuật toán, tống thời gian thực hiện của các pha cố định nhãn là 0(1 k| 2 ). 

Mồi lượt của vòng lặp repeat...until khi cố định nhãn đỉnh u sẽ phải duyệt danh 
sách các đỉnh nối từ u đế thực hiện pha sửa nhẵn. Vì vậy xét trên toàn thuật 
toán, tổng thời gian thực hiện của các pha sửa nhãn là 0(X UE ^ deg + (ií)) = 
0 (|£|). 

Vậy thủ tục Dijkstra thực hiện trong thời gian 0(|v| 2 + |i?|). 

□ Kết hợp với hàng đợi ưu tiên 

Đe thuật toán Dijkstra làm việc hiệu quả hon, người ta thường kết hợp với một 
cấu trúc dữ liệu hàng đợi ưu tiên chứa các đỉnh tự do có nhãn V +00 để thuận 
tiện trong việc lấy ra đỉnh có nhãn nhỏ nhất cũng như cập nhật lại nhãn của các 
đỉnh. Hàng đợi ưu tiên cần hồ trợ các thao tác sau: 

• Extract : Lấy ra một đỉnh ưu tiên nhất (đỉnh u có d[u] nhỏ nhất) khỏi hàng 
đợi ưu tiên. 

• Update(v ): Thao tác này báo cho hàng đợi ưu tiên biết rằng nhãn d[v] đã 
bị giảm đi, cần tổ chức lại (thêm V vào hàng đợi ưu tiên nếu V đang nằm 
ngoài). 

Khi đó thuật toán Dijkstra có thể viết theo mô hình mới sử dụng hàng đợi ưu 
tiên: 

Init; 

PQ := (s); //Hàng đợi ưu tiên được khởi tạo chỉ gồm đỉnh xuất phát 

repeat 

u := Extract; //Lấy ra đỉnh u có d[u] nhỏ nhất 
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if u = t then Break; 

for V (u, V) 6 E do 

if Relax(u, v) then Update(v); 

until PQ = 0; 

if d[t] = +“ then 

Output <— Không có đường 

else 

«Truỵ vết tìm đường đi từ s tới t» 

Vòng lặp repeat.. .until mồi lần sẽ lấy một đỉnh khỏi hàng đợi ưu tiên và đỉnh lấy 
ra sẽ không bao giờ bị đẩy vào hàng đợi ưu tiên lại nữa. Vòng lặp for bên trong 
xét trong tổng thế cả chưong trình sẽ duyệt qua tất cả các cung (lí, v) của đồ thị. 
Vậy thuật toán Dijkstra cần thực hiện không quá n phép Extract và m phép 
Update với n là số đỉnh và m là số cung của đồ thị. 

Trong chuông trình cài đặt thuật toán Dijkstra dưới đây tôi sử dụng Binary Heap 
để biếu diễn hàng đợi ưu tiên, khi đó thời gian thực hiện giải thuật sẽ là 
0(nlgn + mlgn). Ngoài cấu trúc Binary Heap, người ta cũng đã nghiên cứu 
nhiều cấu trúc dữ liệu hiệu quả hon để biểu diễn hàng đợi ưu tiên, chẳng hạn 
Fibonacci Heap[17], Relaxed Heap[ll], 2-3 Heap[39], v.v... Những cấu trúc 
dữ liệu này cho phép cài đặt thuật toán Dijkstra chạy trong thời gian 0(nlgn + 
rù). Tuy nhiên việc cài đặt các cấu trúc dữ liệu này khá phức tạp, các bạn có thể 
tham khảo trong những tài liệu khác. 


a 

DUKSTRAHEAP.PAS V Thuật toán Dijkstra và cấu trúc Heap 


{$MODE OBJFPC} 

program Dij kstraShortestPathUsingHeap; 

const 

maxN = 10000; 

maxM = 100000; 

maxW = 100000; 

maxD = maxN * maxW; 

type 

TAdjNode = record //cấu trúc nút của danh sách kề 
v: Integer; //Đỉnh kề 
w : Integer; //Trọng số cung tương ứng 
link: Integer; //Chỉ số nút kế tiếp trong cùng danh sách kề 
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end; 

THeap = record //cấu trúcHeap 

Items: array [ 1. .maxN] of Integer; //Các phần tử chứa trong 
nltems: Integer; //số phần tử chúa trong 
Pos: array[1..maxN] of Integer; 

//Pos[v] = vị trí của đỉnh V trong Heap 

end; 

var 

adj : array [ 1. .maxM] of TAdjNode; //Mảng chứa tất cả các nút 

head: array[1..maxN] of Integer; 

//head[u]: Chỉ so nút đứng đầu danh sách kề của u 

d: array[1..maxN] of Integer; 
trace: array[1..maxN] of Integer; 
n, m, s, t: Integer; 

Heap: THeap; 

procedure Enter; //Nhập dữ liệu 

var i, u: Integer; 

begin 

ReadLn(n, m, s, t); 

FillChar(head[1], n * SizeOf(head[1]), 0); 

//Khởi tạo các danh sách kề rỗng 

f or i := 1 to m do 
begin 

ReadLn(u, adj[i]. V, adj[i].w); 

//Đọc một cung (u, v) trọng so w, đưa V và w vào trong nút adj[i] 

adj [i ] . link := head[u]; //Chèn nút adj[i] vào đầu danh sách kề của u 

head [u] := i; //Cập nhật chỉ số nút đứng đầu danh sách kề của u 

end; 

end; 

procedure Init; 
var v: Integer; 

begin 

for V := 1 to n do d[v] := MaxD; 
d[s] := 0; 

with Heap do //Khởi tạo Heap chỉ chứa mỗi phần tử s 
begin 

FillChar(Pos [ 1], n * SizeOf (Pos [ 1]), 0); 

Items[1] := s; 

Pos [s] := 1; 
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nltems := 1; 

end; 

end; 

function Extract: Integer; //Lấy đỉnh u có nhãn d[u] nhỏ nhất ra khỏiHeap 
var p, c, v: Integer; 

begin 

with Heap do 
begin 

Result : = It em s [ 1 ] ; //Trả về đỉnh ở gốc Heap 
V := Items [nltems ] ; //Vun lại Heap bằng phép Down-Heap 
Dec(nltems); 
p := 1; //Bắt đầu từ gốc 

repeat 

//Tìm c là nút con chứa đỉnh mang nhãn khoảng cách nhỏ hơn trong hai nút con 

c : = p * 2 ; 
if (c < nltems) 

and (d[Items[c + 1]] < d[Items[c]]) then 
Inc (c); 

if (c > nltems) 

or (d[v] <= d[Items[c]]) then Break; 

Items [p] := Items [c] ; //Chuyển đỉnh từclênp 

Pos [Items [p] ] := p; //Cập nhật vị trí 

p : = c; //Đi xuống nút con 
until False; 

Items [p] := v; //Đặt đỉnh V vào nút p của Heap 

Pos [ V ] := p; //Cập nhật vị trí 

end; 

end; 

procedure Update(v: Integer) ; //d[v] vừa bị cực tiểu hóa, tổ chức lại Heap 

var p, c: Integer; 

begin 

with Heap do 
begin 

c : = Po s [ V ] ; //c là vị trí của đỉnh V trong Heap 
i f c = 0 then //Nếu V chưa có trong Heap 
begin 

Inc(nltems); 

c := nltems; //Cho V vào Heap ở vị trí một nút lá 
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end; 

repeat //Thực hiện Up-Heap 

p : = c di V 2 ; //Xét nút cha của c 

if (p = 0) or (d[Items[p]] <= d[v]) then Break; 

//Dừng nếu đã xét lên gốc hoặc gặp vị trí đúng 

Items [c] := Items [p] ; //Kéo đỉnh từ nút cha xuống nút con 

Pos [Items [c] ] := c; //Cập nhật vị trí 

c : = p; //Đi lên nút cha 
until False; 

Iteras [c] := v; //ĐặtVvào nútc 

Pos [ V ] := c; //Cập nhật vị trí 

end; 

end; 

íunction Relax(u, v: Integer; w: Integer): Boolean; 

//Phép co theo cạnh (u, v) trọng số IV 

begin 

Result := d[v] > d[u] + w; 
if Result then 
begin 

d [ V ] : = d [ u ] + w; 

trace [v] := u; 

end; 

end; 

procedure Dijkstra; //Thuật toán Diịkstra 

var u, i: Integer; 

begin 

repeat 

u := Extract; //Lấy ra đỉnh u có d[u] nhỏ nhất 
if (u = 0) or (u = t) then Break; 
i := he ad [ u ] ; //Duyệt từ đầu danh sách kề của u 

while i <> 0 do 
begin 

if Relax(u, adj[i].V, adj[i].w) then 

//Nếu thực hiện được phép co 

Update(adj [i] . v) ; //Tổ chức lại Heap 
i := adj [ ± ] . link; //Chuyến sang nút kế tiếp trong danh sách kể 
end; 

until Heap.nltems = 0; 

end; 
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procedure PrintResult; //In kết quả 

begin 

if d[t] = maxD then 

WriteLn ( 'There is no path from ', s, ' to t) 

else 

begin 

WriteLn('Distance from ', s, ' to t, 

d [ t ] ) ; 

Víhile t <> s do 
begin 

Write (t, 
t := trace[t]; 

end; 

WriteLn (s); 

end; 

end; 

begin 

Enter; 

Init; 

Dij kstra; 

PrintResult; 

end. 

g) Đường đi ngắn nhất trên đồ thị không có chu trình 
□ Thuật toán 

Xét trường hợp đồ thị có hướng, không có chu trình (Directed Acyclic Graph 
- DAG), có một thuật toán hiệu quả đế tìm đường đi ngắn nhất dựa trên kỳ thuật 
sắp xếp Tô pô (Topological Sorting), cơ sở của thuật toán dựa vào định lý: Neu 
G — (V, E ) là một DAG thì các đỉnh của nó có thế đánh số sao cho mỗi cung của 
G chỉ nối từ đỉnh có chỉ số nhỏ hơn đến đỉnh có chỉ số lớn hơn. 
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Hình 2.2. Phép đánh chỉ số lại theo thứ tự tô pô 


Phép đánh số theo thứ tự tô pô đã được trình bày trong thuật toán Kosaraju- 
Sharir (Error! Reíerence source not found., Mục Error! Reference source 
not found.): Dùng thuật toán tìm kiếm theo chiều sâu trên đồ thị đảo chiều và 
đánh số các đỉnh theo thứ tự duyệt xong (Finish). 


procedure TopoSort; 

procedure DFSVisit(vGV); 

//Thuật toán tìm kiếm theo chiều sâu từ đỉnh V trên đồ thị đảo chiều 

begin 

avail [v] := False; //availỊv] = False <=>v đã thăm 

for Vu G V : (u, v)GE do //Duyệt mọi đỉnh V chưa thăm nối đến u 

if avail[u] then 

DFSVÌSÌt (u) ; //Gọi đệ quy đế tìm kiếm theo chiều sâu từ đỉnh u 
«Đánh số v»; //Đánh số V theo thứ tự duyệt xong 

end; 

begin 

for Vv GV do avail[v] := True; //Đánh dấu mọi đỉnh đều chưa thăm 

for Vv G V do 

if avail[v] then DFSVisit (v); 

end. 

Một cách khác đế đánh số theo thứ tự tô pô là sử dụng thuật toán tìm kiếm theo 
chiều rộng: Với mỗi đỉnh V ta tính và lưu trữ deg - [u] là bán bậc vào của nó. Sử 
dụng một hàng đợi chứa các đỉnh có bán bậc vào bằng 0 (đỉnh không có cung đi 
vào). Sau đó cứ lấy một đỉnh u khỏi hàng đợi, đánh số cho đỉnh lí đó và xóa 
đỉnh u khỏi đồ thị. Việc xóa đỉnh u khỏi đồ thị tưong đưong với việc giảm tất cả 
các deg - [v] của những đỉnh V nối từ lí đi 1, nếu deg _ [u] bị giảm về 0 thì đấy V 
vào hàng đợi để chờ...Quá trình đánh số sẽ kết thúc khi hàng đợi rồng (tất cả 
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các đỉnh đều đã được đánh số thứ tự mới). Phương pháp này tuy cài đặt có dài 
dòng hơn và chậm hơn một chút nhưng không cần sử dụng đệ quy. 

Neu các đỉnh được đánh số sao cho mồi cung phải nối từ một đỉnh tới một đỉnh 
khác mang chỉ số lớn hơn thì thuật toán tìm đường đi ngắn nhất có thế thực hiện 
khá đơn giản: 

Init; 

for V := s + 1 to t do 

for Vu: (u, v) 6E do Relax(u, v) ; //Co theo các cung nối tới V 

CÓ thể thấy rằng sau mồi bước lặp với đỉnh V, nhãn d[v ] không thế co thêm 
được nữa (d[u\ — ỗ(s,u)). 

□ Cài đặt 

Vì mục tiêu của chúng ta chỉ cần tìm đường đi từ s tới t, vì thế chúng ta chỉ cần 
đánh số thứ tự tô pô cho những đỉnh đến được t bằng lời gọi DF SVisit(t), 
những đỉnh đến được từ t (có thứ tự tô pô lớn hơn t) sẽ bị bỏ qua. 

Cách cài đặt thông thường nhất đế tìm đường đi ngắn nhất trên đồ thị không có 
chu trình là tách biệt hai pha: sắp xếp tô pô và tối ưu nhãn. Pha sắp xếp tô pô 
trước hết thực hiện tìm kiếm theo chiều sâu trên đồ thị đảo chiều bằng lời gọi 
DFSVisit(t). Mồi khi một đỉnh được duyệt xong (đánh số thứ tự tô pô), nó sẽ 
được đẩy vào một hàng đợi. Pha tối ưu nhãn lần lượt lấy các đỉnh ra khỏi hàng 
đợi (theo đúng thứ tự tô pô) và thực hiện phép co theo tất cả các cung nối tới 
đỉnh vừa lấy ra. Cách cài đặt này có ưu điếm là khá sáng sủa, trong trường hợp 
mà ta bỏ qua được khâu sắp xếp tô pô hoặc có thể xác định thứ tự tô pô bằng 
một cách đơn giản hơn, chương trình trở nên rất gọn. 

Tuy nhiên nếu ta phải giải quyết bài toán tổng quát bao gồm cả hai pha sắp xếp 
tô pô và tối ưu nhãn thì có thế khéo léo lồng pha tối ưu nhãn vào pha sắp xếp tô 
pô: Trước khi đỉnh V được đánh số (duyệt xong), ta thực hiện tất cả các phép co 
theo các cung ( u, v) với mọi đỉnh u nối đến V. 


H SHORTESTPATHDAG.PAS V Đường đi ngắn nhất trên DAG 


{$MODE OBJFPC} 
program DAGShortestPath; 

const 

maxN = 10000; 
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maxM = 100000; 
maxW = 100000; 
maxD = maxN * maxW; 

type 

TAdjNode = record //cấu trúc nút của danh sách kể dạng reverse star 
u: Integer; //Đỉnh kề 
w: Integer; //Trọng số cung tương ứng 
link: Integer; //Chỉsố nút kế tiếp trong cùng danh sách kề 
end; 
var 

adj : array [ 1. .maxM] of TAdjNode; //Mảng chứa tất cả các nút 
head: array[1..maxN] of Integer; 

//head[u]: Chỉ số nút đứng đầu danh sách kề của u 
d: array [ 1. .maxN] of Integer; //Nhãn khoảng cách 
trace: array [ 1. .maxN] of Integer; //vết 
avail: array[1..maxN] of Boolean; 
n, m, s, t: Integer; 
procedure Enter; //Nhập dữ liệu 
var i, v: Integer; 
begin 

ReadLn(n, m, s, t); 

FillChar(head[1], n * SizeOf(head[1]), 0); 

for i := 1 to m do 
begin 

ReadLn(adj[i].u, V, adj[i].w); 

//Đọc một cung (u, v) trọng số w, đưa uvàw vào trong nút adj[i] 

adj [ỉ] . link := head[v] ; //Chèn nút adj[i] vào đầu danh sách kề của V 

head [ v] := i; //Cập nhật chi so nút đứng đầu danh sách kề ciia V 

end; 

end; 

procedure Init; 
var v: Integer; 

begin 

FillChar(avail[1], n * SizeOf(avail[1]), True); 
for V := 1 to n do d[ v] := maxD; 
d[s] := 0; 

end; 

procedure Relax(u, v: Integer; w: Integer); 
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begin 

if (d[u] < maxD) and (d[v] > d[u] + w) then 
begin 

d [ V ] : = d [ u ] + w; 

trace [v] := u; 

end; 

end; 

procedure DFSVisit(v: Integer) ; //DFS trên đồ thị đảo chiều 
var i: Integer; 

begin 

avail[v] := False; 

i := head[v]; 

while i <> 0 do //Duyệt danh sách các đỉnh nối đến V 
begin 

if avail[adj[i].u] then 

//adj[i].u là một đỉnh nối đến V, nếu adj[i].u chưa thăm thì đi thăm, 

DFSVisit(adj [i] . u) ; //sau lời gọỉ này d[adj[i].u] sẽ bằng ô(s, adj[i].u) 
Relax(adj [i] .u, V, adj ti] . w); 

//Thực hiện luôn phép co (adj[i].u, v) 

i := adj [i] .link; //Nhảy sang nút kế tiếp trong danh sách kề 
end; 

end; //Khi thủ tục kết thúc, d[v] sẽ bằng õ(s,v) 
procedure PrintResult; //Inkếtquả 

begin 

if d[t] = maxD then 

WriteLn ( 'There is no path from ', s, ' to t) 

else 

begin 

WriteLn('Distance from ', s, ' to t, 

d [ t ] ) ; 

while t <> s do 
begin 

Write (t, 
t := trace[t]; 

end; 

WriteLn (s); 

end; 

end; 
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begin 

Enter; 

Init; 

DFSVisit(t); 

PrintResult; 

end. 

Thời gian thực hiện giải có thế đánh giá qua thời gian thực hiện giải thuật DFS, 
tức là bằng OdEl) khi đồ thị đuợc biếu diễn bởi danh sách kề. 

1.3. Đường đi ngắn nhất giữa mọi cặp đỉnh 

Trong một số ứng dụng thực tế, đôi khi nguời ta ta có nhu cầu tính sẵn đường đi 
ngắn nhất giữa mọi cặp đỉnh của đồ thị ( aìl-paỉrs shortest paths ) đế trả lời 
nhanh những truy vấn tìm đuờng đi ngắn nhất mà không cần thực hiện lại thuật 
toán. Rõ ràng ta có thể áp dụng thuật toán tìm đuờng đi ngắn nhất xuất phát từ 
một đỉnh với n luợt chọn đỉnh xuất phát, nhung những thuật toán trong mục này 
có thế thực hiện nhanh hon và đon giản hon nhiều. 

a) Thuật toán Floyd 

Cho đon đồ thị có hướng, có trọng số G — (V, E ) với n đỉnh và m cung. Thuật 
toán Floyd tính tất cả các phần tử của ma trận khoảng cách D — {d uv } nxn , trong 
đó d[u, v] là khoảng cách từ u tới V. Cách làm tưong tự như thuật toán Warshall 
để tìm bao đóng đồ thị: từ ma trận trọng số w — {w[u, v]} nxn , trong đó 
w[v, V ] = 0, Vu G V, thuật toán Floyd tính lại các w[u, V ] thảnh độ dài đường đi 
ngắn nhất từ u tới V theo cách sau: Với v/c 6 V được xét theo thứ tự từ 1 tới n, 
thuật toán xét mọi cặp đỉnh u, V và cực tiểu hóa w[u, v] theo công thức: 

w [u, V] mi := min{w [lí, v] cũ , w [u, k] + w[k,v]} (1.4) 

Tức là nếu như đường đi từ lí tới V đang có lại dài hon đường đi từ lí tới k cộng 
với đường đi từ k tới V thì ta huỷ bỏ đường đi từ u tới V hiện thời và coi đường 
đi từ u tới V sẽ là nối của hai đường đi từ lí tới k rồi từ k tới v: 


for k := 1 

to 

n do 


for u := 

1 

to n do 


for V 

= 

1 to n do 


w [u, 

V] 

:= min (w[u, v], w[u, k] + w[k, v] 

) ; 
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□ Tính đúng của thuật toán 

Gọi ố k (u,v) là độ dài đường đi ngắn nhất từ lí tới V mà chỉ đi qua các đỉnh 
trung gian thuộc tập { 1 , 2 , ..., k} . Rõ ràng khi k — 0 thì ỗ 0 (u,v) —w[u,v] 
(đường đi ngắn nhất là đường đi trực tiếp không qua đỉnh trung gian nào). 

Neu đường đi ngắn nhất từ u tới V mà chỉ qua các đỉnh trung gian thuộc tập 
{1,2, lại: 

• Không đi qua đỉnh k , tức là chỉ qua các đỉnh trung gian thuộc tập 
{1,2, ...,k — 1} thì s k (u,v) — (*>/<;_! (lí, u). 

• Có đi qua đỉnh k, thì đường đi đó sẽ là nối của một đường đi ngắn nhất từ u 
tới k và một đường đi ngắn nhất từ k tới V, hai đường đi này chỉ đi qua các 
đỉnh trung gian thuộc tập {1,2, ...,k — 1} , vậy 5 k (u,v ) = ổ fc _ 1 (u,/í) + 

ỏk -1 (k, v). 

Vì ta muốn ỏ k (u, v) nhỏ nhất nên suy ra: 

s k (ụ,v) = min{S k _ 1 (u, v), ổ k _ 1 (u, k) + ổ fc _ 1 (/c,u)} (1.5) 

Cuối cùng ta quan tâm tới các ố n (u, v): Độ dài đường đi ngắn nhất từ lí tới V mà 
chỉ đi qua các đỉnh trung gian thuộc tập { 1 , 2 , ..., ĩìị, tức là khoảng cách giữa lí và 
v: ô(u, v). 

Ta sẽ chứng minh rằng sau mồi bước lặp của vòng lặp “for k..thì: 

w[u,v] < ô k (u,v) ( 1 . 6 ) 

Phép chứng minh được thực hiện quy nạp theo k. Ký hiệu w k [u,v] là giá trị 
w [lí, V ] sau vòng lặp thứ k , khi k = 0 thì như đã chỉ ra ở trên, w 0 [ u , V ] — 
5 0 (u, v). Giả sử bất đẳng thức đúng với k — 1, trước hết dề thấy rằng các 
w[u, v] sẽ được tối ưu hóa giảm dần theo từng bước. Từ công thức (1.5), ta có: 

ỗ k (u,v) = min Ì 8 k _ 1 (u, u) , ốfc_i(th Q + ỏk-iỊX ỳ) 

V >w fc _)(u,v) >Wfe_!(u,fc) >Wfe_ 1 (fc,v) 

> w k [lí, v] 

Mặt khác có thế thấy thuật toán Floyd tìm được w n [u, v] là độ dài của một 
đường đi từ u tới V. Tức là w n [ií, V] > 5 n (u, v). Từ những kết quả trên suy ra 
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khi kết thúc thuật toán, w n (u,v ) = ỗ n (u,v) — ỏ(u,v) là độ dài đường đi ngắn 
nhất từ u tới V. 

□ Cài đặt 

Ta sẽ cài đặt thuật toán Floyd trên đồ thị có hướng gồm n đỉnh, m cung với 
khuôn dạng Input/Output như sau: 

Input 

• Dòng 1 chứa số đỉnh n < 10 3 , số cung m < 10 6 của đồ thị, đỉnh xuất phát 
s, đỉnh cần đến t. 

• m dòng tiếp theo, mỗi dòng có dạng ba số u, V, w, cho biết (lí, v) là một 
cung e E và trọng số của cung đó là w (w là số nguyên có giá trị tuyệt đối 
< 10 5 ) 

Output 

Đường đi ngắn nhất từ s tới t và độ dài đường đi đó. 


Thuật toán Floyd chỉ cần thực hiện một lần trên đồ thị và khi cần tìm đường đi 
ngắn nhất giữa một cặp đỉnh khác, ta chỉ cần dò đường dựa trên ma trận khoảng 
cách mà thôi. Trên thực tế người ta thường kết hợp với một co chế lưu vết đế trả 
lời nhanh nhiều truy vấn về đường đi ngắn nhất: Gọi trace[u,v] là đỉnh đứng 
liền sau u trên đường đi ngắn nhất từ lí tới V . Sau mồi phép cực tiểu hóa 
c[u, V ] := c[it, k] + c[k, V ] (đường đi ngắn nhất từ u tới V phải đi vòng qua k), ta 
cập nhật lại vết trace [u, V] ■■= trace [u, k]. 



Sample Input 

Sample Output 

6 7 14 

Distance from 1 to 4: 15 

12 1 

l->2->3->6->5->4 

1 6 10 


2 3 2 


3 4 20 


3 6 3 


5 4 5 


6 5 4 
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a 

FLOYD.PAS ^ Thuật toán Floyd 


{$MODE OB JFPC } 

program FloỵdAllPairsShortestPaths ; 

const 

maxN = 1000; 

maxW = 1000; 

maxD = maxN * maxW; 

var 

w: array [ 1. .maxN, l..maxN] of Integer; //Ma trận trọng số 
trace: array [ 1. .maxN, l..maxN] of Integer; //vết 
n, m, s, t: Integer; 

procedure Enter; //Nhập dữ liệu, các cạnh không có được gán trọng so +00 

var 

i, u, V, weight: Integer; 

begin 

ReadLn(n, m, s, t); 

for u := 1 to n do 

for V := 1 to n do 

if u = V then w [ u , V ] := 0 

else w[u, v] := maxD; 

for i := 1 to m do 

begin 

ReadLn(u, V, weight) ; 
if w[u, v] > weight then 

//Phòng trường họp nhiều cung nối từ u tới V (đa đồ thị) 

w[u, V ] := weight; //Chí ghi nhận cung trọng số nhở nhất 

end; 

end; 

procedure Floyd; 
var k, u, v: Integer; 

begin 

for u := 1 to n do 

for V := 1 to n do trace[u, v] := v; 

//Khởi tạo đường đi ngắn nhất là đường đi trực tiếp 
for k := 1 to n do 

for u := 1 to n do 

if w[u, k] < maxD then 

for V := 1 to n do 
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if (w[k, v] < maxD) 

and (w[u, V] > w[u, k] + w[k, V]) then 

begin //Cực tiếu hóa c[u, v] 

w [ u, V ] :=w[u, k ] + w [ k, V ] ; 

//Ghi nhận đường đi vòng qua k 

trace [u, v] := trace [u, k] ; //Lưuvết 

end; 

end; 

procedure PrintResult; //In kết quả 

begin 

if w[s, t] = maxD then 

WriteLn('There is no path from ', s, ' to t) 

else 

begin 

WriteLn('Distance from ', s, ' to ', t, 

' , w [ s, t ] ) ; 

while s <> t do 
begin 

Write (s, 

s := trace[s, t]; 

end; 

WriteLn (t); 

end; 


end; 

begin 

Enter; 

Floyd; 

PrintResult; 

end. 


Dễ thấy rằng thời gian thực hiện giải thuật Floyd là 0(n 3 ) và chi phí bộ nhó' là 
0(n 2 ). 


b) Thuật toán Johnson 

Trong trường hợp G — ( V,E ) là đồ thị thưa gồm n đỉnh và m cạnh: m « n 2 , 
thuật toán Johnson tìm đường đi ngắn nhất giữa mọi cặp đỉnh hoạt động hiệu 
quả hon thuật toán Floyd. Bản chất của thuật toán Johnson là thực hiện thuật 
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toán Bellman-Ford để gán lại trọng số và thực hiện tiếp thuật toán Dykstra để 
tìm đường đi ngắn nhất. 

Neu đồ thị không có cạnh trọng số âm, ta có thế thực hiện thuật toán Dykstra n 
lần với cách chọn lần lượt n đỉnh làm đỉnh xuất phát. Bằng cách kết hợp với một 
hàng đợi ưu tiên được tổ chức dưới dạng Fibonacci Heap, thời gian thực hiện 
một lần thuật toán Dykstra là 0(n lgn + m ), và như vậy ta có thể tìm đường đi 
ngắn nhất giữa mọi cặp đỉnh trong thời gian 0(n 2 lgn + mrì). 

Neu đồ thị có cạnh trọng số âm nhưng không có chu trình âm, thuật toán 
Johnson thực hiện một kỳ thuật gọi là gán lại trọng so (re-weighting) . Tức là 
trọng số w: E -» R sẽ được biến đổi thành trọng số w: E -* M thỏa mãn hai điều 
kiện sau đây: 

• Với mọi cặp đỉnh u, V G V, đường đi p là đường đi ngắn nhất từ u tới V ứng 
với trọng số w nếu và chỉ nếu p cũng là đường đi ngắn nhất từ lí tới V ứng 
với trọng số w 

• Với mọi cạnh e G E, trọng số w(e) là một số không âm 

Định lý 1-2 

Cho đồ thị G — (V, E ) với trọng số w: E -> R. Gọi h: V -> M là một hàm gán cho 
mồi đỉnh V một số thực h(v). Xét trọng số w: E R định nghĩa bởi: 


w(it, v) — w(u, v) + h(u) — h(v) 


Xét p = (v 0 , v v ..., v k ) là một đường đi từ v ữ tới v k , khi đó p là đường đi ngắn 
nhất từ v 0 tới v k với trọng số w nếu và chỉ nếu p là đường đi ngắn nhất từ v 0 tới 
v k với trọng số w. FIan nữa G có chu trình âm tưong ứng với trọng số w nếu và 
chỉ nếu G có chu trình âm với trọng số w. 


Chứng minh 

Kỷ hiệu w(p) và w(p) lần lượt là độ dài đường đi p với trọng số w và w. Ta có 


k 



i =1 
k 


^(w(v í _ 1 ,l7 í ) + hOi-i) - h(v)) 


1=1 
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w(v i _ 1 ,v i ) + h(v 0 ) -ft( v k ) 


<i= 1 


= w(p) + ft(v 0 ) - h{v k ) 

Vậy qua phép biến đổi trọng số, độ dài mọi đường đi từ v 0 tới v k sẽ được cộng 
thêm một lượng h(17 0 ) — /i(i7 fc ). Hay nói cách khác, đường đi nào ngắn nhất với 
trọng số w cũng là đường đi ngắn nhất với trọng số w. 

Nếu p là một chu trình, v 0 — v k , ta suy ra w(p) = w(p). Độ dài của chu trình 
được bảo toàn qua phép biến đối trọng số, tức là G có chu trình âm với trọng số w 
nếu và chi nếu G có chu trình âm với trọng số w. 

Mục tiêu tiếp theo là chỉ ra một phép gán trọng số mới cho đồ thị G đế đảm bảo 
các trọng số không âm. Neu G không có chu trình âm ta thêm vào đồ thị một đinh 
giả s và các cung nối từ đinh s tới tất cả các đinh còn lại của đồ thị, trọng số của 
các cung này được đặt bằng 0. Do đính s không có cung đi vào, đồ thị mới tạo 
thành cũng không có chu trình âm. Thực hiện thuật toán Bellman-Ford trên đồ thị 
mới với đỉnh xuất phát s đế xác định các h[v] — S(s,v) là độ dài đường đi ngắn 
nhất từ s tới V tương ứng với trọng số c. 

Định lý 1-3 

Trọng số w: E -» M xác định bởi w(it, V ) = w(it, V ) + h[u] — h[v ] là một hàm 
trọng số không âm. 

Chứng minh 

Khi thuật toán Bellman-Ford kết thúc, sẽ không tồn tại một cạnh (u, V ) nào mà 

h(v) > h(u ) + w(ii, 17) 

hay nói cách khác, với mọi cạnh (u, v) của đồ thị, ta có 

w(u, 17) + h(u ) — h(ĩ 7 ) > 0 

Các nhận xét kế trên, đặc biệt là Định lý 1-2 và Định lý 1-3, cho ta mô hình cài 
đặt thuật toán Johnson: 

• Thêm vào đồ thị một đỉnh s và các cung trọng số 0 nối từ s tới tất cả các 

đỉnh khác, dùng thuật toán Bellman-Ford tính các h[v] là độ dài đuờng đi 

ngắn nhất từ s tới V. Thời gian thực hiện giải thuật 0 (nm) 

• Loại bỏ s và các cung mới thêm vào khỏi đồ thị, gán lại trọng số 

cạnh w(it, v) := w(u,v ) + h[u] — h[v] với mọi cạnh (lí, v) G E. Thời gian 

thực hiện giải thuật 0(m) 
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• Lần lượt lấy các đỉnh V £ V làm đỉnh xuất phát, thực hiện thuật toán 
Dykstra đế tìm đường đi ngắn nhất từ V tới tất cả các đỉnh khác. Thời gian 
thực hiện giải thuật 0(n 2 lgn + nvrì) nếu sử dụng Fibonacci Heap 

Vậy thuật toán lohnson tìm đường đi ngắn nhất giữa mọi cặp đỉnh có thể thực 
hiện trong thời gian 0(n 2 lgn + nrrì). Thuật toán dựa trên hai thuật toán đã biết 
để tìm đường đi ngắn nhất xuất phát từ một đỉnh, việc cài đặt xin dành cho bạn 
đọc. 

1.4. Một số chú ỷ 

Ở một số chương trình trong bài, đôi khi ta sử dụng ma trận trọng số và đem 
trọng số +00 gán cho những cạnh không có trong đồ thị ban đầu, hay khi khởi 
tạo các nhãn khoảng cách, chúng ta thường gán d[v] ■— +00 và cực tiếu hóa dần 
các nhãn đó. Trên máy tính thì không có khái niệm trừu tượng +00 nên ta sẽ 
phải chọn một số dương maxD đủ lớn đế thay. Như thế nào là đủ lớn?, số đó 
phải đủ lớn hơn tất cả trọng số của các đường đi đơn để cho dù đường đi thật có 
tồi tệ đến đâu vẫn tốt hơn đường đi trực tiếp theo cạnh tưởng tượng ra đó. 

Trong trường hợp đồ thị có cạnh trọng số âm, cần cẩn thận với phép cộng trọng 
số: Neu một trong hai hạng tử là maxD, ta coi như tống bằng maxD (C + 00 = 
oo) và không cần cộng nữa. Lý do thứ nhất là đế hạn chế lồi tràn số khi hằng số 
maxD trong bài toán cụ thể quá lớn, lý do thứ hai là đế không bị tính sai khi 
cộng maxD với một số âm được kết quả < maxD, khi đó rất có thể d[t] < 
maxD mặc dù không tồn tại đường đi từ s tới t. 

Những thuật toán tìm đường đi ngắn nhất bộc lộ rất rõ ưu, nhược điểm trong 
từng trường hợp cụ thế (Ví dụ như số đỉnh của đồ thị quá lớn làm cho không thể 
biểu diễn bằng ma trận trọng số thì thuật toán Floyd sẽ gặp khó khăn, hay thuật 
toán Ford-Bellman làm việc khá chậm). Vì vậy cần phải hiếu bản chất và thành 
thạo trong việc cài đặt tất cả các thuật toán trên để có thế sử dụng chúng một 
cách uyến chuyến trong từng bài toán thực tế. 
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Bài tập 

2.1. Cho đồ thị có hướng G — (V, E ) không có chu trình âm, hãy tìm thuật toán 
OdkllEl) để tính tất cả các ố*(u ) = min VẸV {ỗ(u,v)} 

2 . 2 . Cho đồ thị có hướng G — ( V, E ) gồm n đỉnh và m cung, hãy tìm thuật toán 
0(nm) đế xác định đồ thị có chu trình âm hay không và chỉ ra một chu 
trình âm nếu có. 

Gợi ý: Thực hiện thuật toán Bellman-Ford (tối đa n — 1 lần quét danh sách 
cạnh và thực hiện phép co), sau đó ta quét lại danh sách cạnh xem có thế 
thực hiện được phép co nào nữa hay không. Neu còn có thế co theo cạnh 
(lí, V ) nào đó, ta kết luận đồ thị có chu trình âm và thực hiện phép co này, 
sau đó lần ngược vết đường đi từ đỉnh V, nếu quá trình lần vết đi lặp lại 
một đỉnh X nào đó, ta có một chu trình bắt đầu và kết thúc ở đỉnh X. 

2 . 3 . Hệ ràng buộc: Cho x 1( x 2 , ..., x n là các biến số, cho m ràng buộc, mỗi ràng 
buộc có dạng: 

Xj -Xị< Wịj, ( Wij E R) 

Vấn đề đặt ra là hãy tìm cách gán giá trị cho các biếnx 1 ,x 2 , ...,x n thỏa 
mãn tất cả các ràng buộc đã cho. 

Gợi ỷ: Có nhiều ví dụ về hệ ràng buộc trên thực tế, chắng hạn một công 
trình xây dựng có n công đoạn. Vì lý do kỳ thuật, một công đoạn Xj không 
được bắt đầu muộn hon Wịj thời gian so với công đoạn Xj. Ràng buộc này 
có thế viết dưới dạng Xj — Xj < Wịj . Một dạng ràng buộc khác là công 
đoạn Xj phải bắt đầu sau khi công đoạn Xj bắt đầu được ít nhất Wịj thời 
gian, ràng buộc này cũng có thế viết dưới dạng Xj — Xi > Wij hay Xj — 
Xj < -Wij. 

Coi mỗi biến là một đỉnh của đồ thị, mỗi ràng buộc Xj — Xj < Wịj cho 
tưong ứng với một cạnh ( Xj,Xj ) có trọng số Wij. Khi đó nếu đồ thị có chu 
trình âm thì không tồn tại giải pháp. Thật vậy, giả sử tồn tại chu trình âm, 
không giảm tính tống quát, giả sử chu trình âm đó là c — 
(x 1 ,x 2 , ...,x fc ,x 1 ), ta có 

x 2 — X-y < w 12 
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x 3 x 2 < w 23 


x 1 ~x k < w kl 

Tổng vế trái của các bất đẳng thức trên bằng 0 và tống vế phải chính là 
trọng số của chu trình (âm), bất đẳng thức 0 < w(c) < 0 không thế được 
thỏa mãn. 

Neu đồ thị không có chu trình âm, ta thêm vào một đỉnh s và các cung nối 
trọng số 0 từ 5 tới mọi đỉnh khác. Dùng thuật toán Bellman-Ford để tìm 
đường đi ngắn nhất từ s, khi đó các nhãn đ[Xj] = ổ(s, Xj) chính là một 
cách gán giá trị thỏa mãn tất cả các ràng buộc. Hon nữa cách này còn làm 
khoảng giá trị gán cho các biến là hẹp nhất: 

maxíx,') — min fx,ì -> min 

i<i<n lkj<n l JJ 

2.4. (Cải tiến của Yen cho thuật toán Bellman-Ford) Với đồ thị có hướng 
G — ( V, E ) gồm n đỉnh, ta đánh số các đỉnh từ 1 tới n, chia tập cạnh E làm 
hai tập con: E t gồm các cung nối từ đỉnh có chỉ số nhỏ tới đỉnh có chỉ số 
lớn và E 2 gồm các cung nối từ đỉnh có chỉ số lớn tới đỉnh có chỉ số nhỏ. 
Đặt G x — (y, E-í) và G 2 — ịy, E 2 ), hai đồ thị này là đồ thị có hướng không 
có chu trình được biểu diễn bằng danh sách kề. 

Thuật toán Bellman-Ford sau đó được thực hiện như sau: 

Init; 

repeat 

stop := True; 

for u := 1 to n - 1 do 

for Vv: (u, v)6El do 

if Relax(u, v) then stop := False; 

for u := n downto 2 do 

for Vv: (u, v)6E2 do 

if Relax(u, v) then stop := False; 
until stop; 

Bên trong vòng lặp repeat...until là hai pha tối ưu nhãn: pha thứ nhất xét 
các đỉnh theo thứ tự tăng dần còn pha thứ hai xét các đỉnh theo thứ tự giảm 
dần của chỉ số. Mồi khi một đỉnh được xét và thực hiện phép co theo tất cả 
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các cung đi ra khỏi lí, mồi pha thực hiện tương tự như thuật toán tìm 
đường đi ngắn nhất trên đồ thị không có chu trình. 

Chỉ ra rằng vòng lặp repeat...until trong cải tiến của Yen lặp không quá 
\n/2] lần. Cài đặt thuật toán và so sánh với cách cài đặt chuẩn của thuật 
toán Bellman-Ford. 

2.5. Arbitrage là một cách sử dụng sự bất hợp lý trong hối đoái tiền tệ đế kiếm 
lời. Ví dụ nếu 1$ mua được 0.7£, 1£ mua được 190¥, 1¥ mua được 0.009$ 
thì từ 1$, ta có thể đổi sang 0.7£, sau đó sang 0.7xl90=133¥, rồi đổi lại 
sang 133x0.009=1.197$. Kiếm được 0.197$ lãi. 

Giả sử rằng có n loại tiền tệ đánh số từ 1 tới n. Bảng R — { Tịj ) x cho biết 
tỉ lệ hối đoái: một đơn vị tiền i đối được Tịj đơn vị tiền j. Hãy tìm thuật 
toán đế xác định xem có thế kiếm lời từ bảng tỉ giá hối đoái này bằng 
phương pháp arbitrage hay không? Neu có thế sử dụng arbitrage, hãy chỉ 
ra một cách kiếm lời. 

2.6. (Thuật toán Karp tìm chu trình có trung bình trọng số nhỏ nhất) Cho đồ thị 
có hướng G — ( V, E ) gồm n đỉnh, hàm trọng số w: E -» R. Ta định nghĩa 
trung bình trọng số của một chu trình c gồm các cạnh (e lt e 2 ,..., e k ) là: 

k 

= £^w(e Ể ) 


ịi* = rnin^CC)} 

Khi đó chu trình c có |U(C) = ịi* gọi là chu trình có trung bình trọng số 
nhỏ nhất ( minimum mean-weight cycỉe). Chu trình có trung bình trọng số 
nhỏ nhất có nhiều ý nghĩa trong các thuật toán tìm luồng với chi phí cực 
tiểu. 

Không giảm tính tổng quát, giả sử mọi đỉnh V G V đều đến được từ một 
đỉnh s G V (Ta có thế thêm một đỉnh giả s và cung trọng số 0 nối từ s tới 
mọi đỉnh khác, s không nằm trên chu trình đơn nào nên không ảnh hưởng 
tới tính đúng đắn của thuật toán). Đặt ổ(v) là độ dài đường đi ngắn nhất từ 
s tới V. Đặt ổ k (v) là độ dài đường đi ngắn nhất trong số các đường đi từ s 
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tới V qua đúng k cạnh (ta có thể thêm vào các cung trọng số đủ lớn đế với 
mọi cặp đỉnh u, V luôn tồn tại cung (lí, V ) và (v, ù) , việc tìm chu trình 
trung bình trọng số nhỏ nhất không bị ảnh huởng bởi nhũng cung thêm 
vào và ỗ k (y) luôn là giá trị hữu hạn). 

a) Chứng minh rằng nếu ụ.* — 0, đồ thị G không có chu trình âm và: 

ỗ(v) — min {ỗ k (v)} ,Vv G V 

0<k<n-l 

b) Chứng minh rằng nếu ụ.* — 0 thì 

ổnO) -ổ/íO) ^ A _ T , 

max -----> 0, Vv E V 

0 <k<n-l n — k 

(Gợi ý: Sử dụng kết quả câu a) 

c) Gọi c là một chu trình trọng số 0, u, V là hai đỉnh nằm trên c, giả sử 
/Ấ* — 0 và X là độ dài đuờng đi từ u tới V dọc theo chu trình c . Chứng 
minh rằng 

ổ(v ) = ổ (lí) + X 

d) Chứng minh rằng nếu /I* = 0 thì trên mỗi chu trình trọng số 0 sẽ tồn tại 
một đỉnh V sao cho: 

8 n (v)-8 k (y) 

max --- 7 "-= 0 

0 <k<n-l n — k 

e) Chứng minh rằng nếu ụ.* — 0 thì 

. 8 n (v)-ổ k (v) 

min max ---—-= 0 

vev 0 <k<n-l n — k 

f) Chỉ ra rằng nếu chúng ta cộng thêm một hằng số A vào tất cả các trọng 
số cạnh thì ịi* tăng lên A. Sử dụng tính chất này đế chứng minh rằng 

*_. ô n (v)-s k (v) 

u — min max ----- 

vev 0 <k<n-l n — k 

g) Tìm thuật toán 0(||V||ir|) và lập chuông trình để tính fi* và chỉ ra một 
chu trình có trung bình trọng số nhỏ nhất. 

2.7. Trên mặt phẳng cho n đuờng tròn, đuờng tròn thứ i đuợc cho bởi bộ ba số 
thực {x i ,y i ,r i '), (Xj,yj) là toạ độ tâm và Tị là bán kính. Chi phí di chuyển 
trên mỗi đuờng tròn bằng 0. Chi phí di chuyến giữa hai đuờng tròn bằng 
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khoảng cách giữa chúng. Hãy tìm phương án di chuyển giữa hai đường 
tròn s, t cho trước với chi phí ít nhất. 

2.8. Thuật toán Dykstra có thế sai nếu đồ thị có cạnh trọng số âm, hãy chỉ ra 
một ví dụ. 

2.9. Cho đồ thị vô hướng G — (V, E ) có n đỉnh và m cạnh, các cạnh có trọng số 
là số nguyên trong phạm vi từ 0 tới k. Hãy thay đổi thuật toán Dỹkstra để 
được thuật toán 0 (kn + m) tìm đường đi ngắn nhất xuất phát từ một đỉnh 
sEk 

Gợi ỷ: Đe ý rằng nếu một nhãn d[v] < +00 thì nhãn này phải là số nguyên 
nằm trong khoảng [0 ... (n — 1) X k], đồng thời nếu xét nhãn khoảng cách 
của các đỉnh lấy ra khỏi hàng đợi ưu tiên thì các nhãn khoảng cách này 
được sắp xếp theo thứ tự không giảm. Ta tổ chức hàng đợi ưu tiên dưới 
dạng bảng băm: q[ 0 ... (n — 1) X k] trong đó q[x ] là chốt của một danh 
sách móc nối chứa các đỉnh V mà d[v] — X. Khi đó các phép chèn, cập 
nhật trên hàng đợi ưu tiên chỉ mất thời gian 0(1). Phép lấy ra một phần tử 
trong hàng đợi ưu tiên tính tổng thể mất thời gian 0(/cn). 

2.10. Tương tự như Bài tập 2.9 nhưng hãy tìm một thuật toán 0((m + rì) log k ) 

Gợi ý: Đe ý rằng tại mồi bước của thuật toán Dijkstra, có tối đa k + 2 giá 
trị khác nhau của các nhẵn d [v] trong hàng đợi ưu tiên. Mỗi giá trị X sẽ 
cho tương ứng với một danh sách móc các nút V mà d[v] — X, các chốt 
của danh sách móc nối được lưu trữ trong một Binary Heap, khi đó các 
phép đẩy vào, lấy ra, co nhẵn khoảng cách được thực hiện trong thời gian 
0(log k). 

2.11. (Thuật toán Gabow) Xét đồ thị G — (y, E) có các trọng số cạnh là số tự 
nhiên: w: E -» N. Giả sử rằng từ đỉnh xuất phát s có đường đi tới mọi đỉnh 
khác. Gọi k là trọng số lớn nhất của các cạnh trong E. Gọi z = [lg(/c + 
1)1, khi đó trọng số mồi cạnh có thế được biếu diễn bằng một dãy z bit. 
Với mỗi cạnh e G E mang trọng số w(e), ta ký hiệu Wj(e) là số tạo thành 
bằng i bít đầu tiên của w(e), tức là: 

Wi(e) — w(e) div 2 Z_Ể , (Vi = 1,2,..., z). 

Ví dụ z = 5 và w(e) = 11 = 01011(2). Ta có: 
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Wi(e) = 0 (2) = 0 

w 2 (e) = 01 (2) = 1 
w 3 (e) = 010 (2) = 2 
w 4 (e) = 0101( 2 ) = 5 
w 5 (e) = 01011(2) = 11 

Định nghĩa (^(s, ư) là độ dài đường đi ngắn nhất từ 5 tới ư trên đồ thị G 
với hàm trọng số Wj. Rõ ràng w z (e) = w(e) nên ỗ z (s,v) — ỗ(s,v) với 
Vư G V. 

a) Giả sử rằng ỗ(s,v) < |£'| với mọi đỉnh V có đường đi từ s, tìm thuật 
toán 0(|iỉ|) để xác định tất cả các 5(s, v). ( Gợi ỷ: Sử dụng hàng đợi ưu 
tiên như trong Errorl Rẹference source not found.). 

b) Chứng minh rằng các (^(s, ỳ) có thế tính được trong thời gian Od£l). 
(Gợi ý: Chú ý rằng các trọng số w x (e) G {0,1}). 

c) Chỉ ra rằng với mọi i = 2,3 Wj(e) = 2.Wj_ 1 (e) hoặc Wj(e) — 
2. Wj_ 1 (e) + 1. Từ đó chứng minh rằng: 

2.ổ Ể _ 1 (s,v) < ôi(s,v) < 2.ổ Ể _ 1 (s,ư) + \v\ 

(Gợi ỷ: Độ dài đường đi ngắn nhất từ s tới V sẽ nhân đôi nếu ta nhân đôi 
các trọng số cạnh ) 

d) Với mọi cạnh e = (lí, ỳ) G E, định nghĩa: 

Wj(e) = Wị(u,v ) = Wị(u,v ) + 2.ổj_ 1 (s, ù) — 2.ổ i _ 1 (s, v) 

Chứng minh rằng với mọi đường đi p: u V, ta có: 

Wi(p ) = Wj(p) + 2. 5 i _ 1 (s, ù) - 2. ổj_ 1 (s, v) 

e) Định nghĩa ối(s, V) là độ dài đường đi ngắn nhất từ s tới V trên đồ thị G 
với hàm trọng số Wj. Chứng minh rằng với i — 2,3,..., z và Vư G V: 

8i(s,v ) = ôi(s,v) - 2.ổ Ể _ 1 (s,ư) < \E\ 

f) Tìm thuật toán tính các ỏi(s,v ) từ các ổị-xCs, v) trong thời gian 0(|Zi|). 
Từ đó chứng minh rằng có thế tìm đường đi ngắn nhất trên đồ thị G trong 
thời gian OdCỊ.x) = Od£l lgfc)- 
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2.12. Cho một bảng các số tự nhiên kích thước m X n. Từ một ô có thế di 
chuyến sang một ô kề cạnh với nó. Hãy tìm một cách đi từ ô (x,y) ra một 
ô biên sao cho tổng các số ghi trên các ô đi qua là nhỏ nhất. 

2.13. Cho một dãy số nguyên A — (a 1; a 2 ,..., a n ). Hãy tìm một dãy con gồm 
nhiều nhất các phần tử của dãy đã cho mà tống của hai phần tử liên tiếp là 
số nguyên tố. 

2.14. Một công trình lớn được chia làm n công đoạn. Công đoạn i phải thực 
hiện mất thời gian tị. Quan hệ giữa các công đoạn được cho bởi bảng 
A — { a ij} nxn trong đó ãij — 1 nếu công đoạn j chỉ được bắt đầu khi mà 
công đoạn i đã hoàn thành và a t j — 0 trong trường hợp ngược lại. Mồi 
công đoạn khi bắt đầu cần thực hiện liên tục cho tới khi hoàn thành, hai 
công đoạn độc lập nhau có thế tiến hành song song, hãy bố trí lịch thực 
hiện các công đoạn sao cho thời gian hoàn thành cả công trình là sớm nhất, 
cho biết thời gian sớm nhất đó. 

Gợi ỷ: Dựng đồ thị có hướng G — ( y,E ), mỗi đỉnh tưong ứng với một 
công đoạn, đỉnh u có cung nối tới đỉnh V nếu công đoạn u phải hoàn thành 
trước khi công đoạn V bắt đầu. Thêm vào G một đỉnh s và cung nối từ 5 tới 
tất cả các đỉnh còn lại. Gán trọng số mỗi cung (lí, V ) của đồ thị bằng ty. 

Neu đồ thị có chu trình, không thế có cách xếp lịch, nếu đồ thị không có 
chu trình (DAG) tìm đường đi dài nhất xuất phát từ s tới tất cả các đỉnh 
của đồ thị, khi đó nhãn khoảng cách d[v ] chính là thời điếm hoàn thành 
công đoạn V, ta chỉ cần xếp lịch đế công đoạn V được bắt đầu vào thời 
điểm d [ V ] — ty là xong. 

2.15. Cho đồ thị G — ( V,E ), các cạnh được gán trọng số không âm. Tìm thuật 
toán và viết chuông trình tìm một chu trình có độ dài ngắn nhất trên G. 

2 . Cây khung nhỏ nhất 

Cho G — ( V, E, w) là đồ thị vô hướng liên thông có trọng số. Với một cây khung 

T của G, ta gọi trọng số của cây T, ký hiệu w(T), là tổng trọng số các cạnh trong 

T. Bài toán đặt ra là trong số các cây khung của G, chỉ ra cây khung có trọng số 

nhỏ nhất, cây khung như vậy được gọi là cây khung nhỏ nhất (minỉmum 
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spannỉng tree) của đồ thị. Sau đây ta sẽ xét hai thuật toán thông dụng đế giải bài 
toán cây khung nhỏ nhất của đon đồ thị vô huớng có trọng số, cả hai thuật toán 
này đều là thuật toán tham lam. 

2.1. Phương pháp chung 

Xét đồ thị vô huớng liên thông có trọng số G — (V, E, w). Cả hai thuật toán để 
tìm cây khung ngắn nhất đều dựa trên một cách làm chung: Nở dần cây khung. 
Cách làm này đuợc mô tả nhu sau: Thuật toán quản lý một tập các cạnh A Q E 
và cố gắng duy trì tính chất sau (tính bất biến vòng lặp): 

A luôn nằm trong tập cạnh của một cây khung nhỏ nhất. 

Tại mỗi buớc lặp, thuật toán tìm một cạnh (lí, v) đế thêm vào tập A sao cho tính 
bất biến vòng lặp đuợc duy trì, tức là A u (lí, v) phải nằm trong tập cạnh của 
một cây khung nhỏ nhất. Ta nói nhũng cạnh (lí, v) nhu vậy là an toàn ( safe ) đối 
với tập A. 

procedure FíndMST; //Tìm cây khung ngắn nhất 

begin 

A := 0; 

while «A chưa phải câỵ khung» do 

begin 

«Tìm cạnh an toàn (u, v) đối với A»; 

A :=AU { (u, V) } ; //Bổ sung (u, v) vào A 

end; 

end; 

Vấn đề còn lại là tìm một thuật toán hiệu quả đế tìm cạnh an toàn đối với tập A. 
Chúng ta cần một số khái niệm đế giải thích tính đúng đắn của những thuật toán 
sau này. 

Một lát cắt (cut) trên đồ thị là một cách phân hoạch tập đỉnh V thành hai tập rời 
nhau X,Y: X u Y = V)X nY — 0. Ta nói một lát cắt V — X UY tưong thích với 
tập A nếu không có cạnh nào của A nối giữa một đỉnh thuộc X và một đỉnh thuộc 
Y. Trong những cạnh nối X với Y, ta gọi những cạnh có trọng số nhỏ nhất là 
những cạnh nhẹ (Ịight edge) của lát cắt V — X u Y. 
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X Y 

Lát cắt 


Hình 2.3. Lát cắt và cạnh nhẹ 

Định lý 2-1 

Cho đồ thị vô hướng liên thông có trọng số G — (y, E, w). Gọi A là một tập con 
của tập cạnh của một cây khung nhỏ nhất và V — X u Y là một lát cắt tưong 
thích với A. Khi đó mỗi cạnh nhẹ của lát cắt V — X u Y đều là cạnh an toàn đối 
với A. 

Chứng minh 

Gọi (li, v) là một cạnh nhẹ của lát cắt V — X u Y, gọi T là cây khung nhỏ nhất 
chứa tất cả các cạnh của A. Nếu T chứa cạnh (u,v), ta có điều phải chứng minh. 
Nếu T không chứa cạnh (u,v), ta thêm cạnh (u, v) vào T sẽ được một chu trình, 
trên chu trình này có đình thuộc X và cũng có đinh thuộc Y, vì vậy sẽ phải có ít 
nhất hai cạnh trên chu trình nối X với Y. Ngoài cạnh (u, v) nối X với Y, ta gọi 
(u', v') là một cạnh khác nối X với Y trên chu trình, theo giả thiết (u, V ) là cạnh 
nhẹ nên w(u, V ) < w(u\ v'). Ngoài ra do lát cắt V = X u Y tương thích với A nên 
(u', V ') Ệl A. 

Cắt bỏ cạnh (u', v') khỏi cây 7, cây sẽ bị tách rời làm hai thành phần liên thông, 
sau đó thêm cạnh (u, V ) vào cây nối lại hai thành phần liên thông đó đế được cây 
r. Ta có 

w(r') = w(T) — w(u', t/) + w(u, 17) 

< IV CO 

Do T là cây khung nhỏ nhất, T' cũng phải là cây khung nhỏ nhất. Ngoài ra cây T' 
chứa cạnh (u, V ) và tất cả các cạnh của A. Ta có điều phải chứng minh. 

Hệ quả 

Cho đồ thị vô hướng liên thông có trọng số G — (y,E,w). Gọi A là một tập con 
của tập cạnh của một cây khung nhỏ nhất. Gọi c là tập các đỉnh của một thành 
phần liên thông trên đồ thị G A — (y,i 4). Khi đó nếu (lí, v) E E là cạnh trọng số 
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nhỏ nhất nối từ c tới một thảnh phần liên thông khác thì (lí, v) là cạnh an toàn 
đối với A. 


Chứng minh 

Xét lát cắt V — c u (1/ — C), lát cắt này tương thích với A và cạnh (u, V ) là cạnh 
nhẹ của lát cắt này. Theo Định lý 3-17, (u, V ) an toàn đối với A. 

Chúng ta sẽ trình bày hai thuật toán tìm cây khung nhỏ nhất trên đon đồ thị vô 
huớng và cài đặt chuông trình với khuôn dạng Input/Output nhu sau: 


Input 

• Dòng 1 chứa số đỉnh n < 1000 và số cạnh m của đồ thị 

• m dòng tiếp theo, mỗi dòng chứa chỉ số hai đỉnh đầu mút và trọng số của 
một cạnh. Trọng số cạnh là số nguyên có giá trị tuyệt đối không quá 1000. 


Output 

Cây khung nhỏ nhất của đồ thị 


Sample Input 

Sample Output 

6 8 

Minimum Spanning Tree: 

12 3 

(5, 6) = 1 

13 3 

(4, 5) = 2 

2 4 3 

(1, 2) = 3 

2 5 3 

(2, 5) = 3 

3 5 4 

(1, 3) = 3 

4 5 2 

Weight = 12 

4 6 2 


5 6 1 








2.2. Thuật toán Kruskal 

Thuật toán Kruskal [27] dựa trên mô hình xây dựng cây khung bằng thuật toán 
hợp nhất, chỉ có điều thuật toán không phải xét các cạnh với thứ tự tuỳ ý mà xét 
các cạnh theo thứ tự đã sắp xếp: Đe tìm cây khung ngắn nhất của đồ thị G — 
(V, E, w), thuật toán khởi tạo cây T ban đầu không có cạnh nào. Duyệt danh sách 
cạnh của đồ thị từ cạnh có trọng số nhỏ đến cạnh có trọng số lớn, mỗi khi xét tới 
một cạnh và việc thêm cạnh đó vào T không tạo thành chu trình đon trong T thì 
kết nạp thêm cạnh đó vào T... Cứ làm như vậy cho tới khi: 
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• Hoặc đã kết nạp được \v\ — 1 cạnh vào trong T thì ta được T là cây khung 
nhỏ nhất 

• Hoặc khi duyệt hết danh sách cạnh mà vẫn chưa kết nạp đủ |k| — 1 cạnh. 
Trong trường hợp này đồ thị G là không liên thông, việc tìm kiếm cây 
khung thất bại. 

Như vậy cần làm rõ hai thao tác sau khi cài đặt thuật toán Kruskal: 

• Làm thế nào để xét được các cạnh từ cạnh có trọng số nhỏ tới cạnh có trọng 
số lớn. 

• Làm thế nào kiểm tra xem việc thêm một cạnh có tạo thành chu trình đon 
trong T hay không. 

a) Duyệt danh sách cạnh 

Vì các cạnh của đồ thị phải được xét từ cạnh có trọng số nhỏ tới cạnh có trọng 
số lớn. Ta có thế thực hiện một thuật toán sắp xếp danh sách cạnh rồi sau đó 
duyệt lại danh sách đã sắp xếp. Tuy nhiên khi cài đặt cụ thể, ta có thế khéo léo 
lồng thuật toán Kruskal vào QuickSort hoặc HeapSort đế đạt hiệu quả cao hơn. 
Chang hạn với QuickSort, ý tưởng là sau khi phân đoạn danh sách cạnh bằng 
một cạnh chốt Pivot, ta được ba phân đoạn: Đoạn đầu gồm các cạnh có trọng số 
< w(Pivot), tiếp theo là cạnh Pivot, đoạn sau gồm các cạnh có trọng số 
> w(Pivot). Ta gọi đệ quy để sắp xếp và xử lý các cạnh thuộc đoạn đầu, tiếp 
theo xử lý cạnh Pivot, cuối cùng lại gọi đệ quy để sắp xếp và xử lý các cạnh 
thuộc đoạn sau. Dề thấy rằng thứ tự xử lý các cạnh như vậy đúng theo thứ tự 
tăng dần của trọng số. Ngoài ra khi thấy đã có đủ n — 1 cạnh được kết nạp vào 
cây khung, ta có thế ngưng ngay QuickSort mà không cần xử lý tiếp nữa. 

b) Kết nạp cạnh và hợp cây 

Trong quá trình xây dựng cây khung, các cạnh trong T ở các bước sẽ tạo thành 
một rừng (đồ thị không có chu trình đơn), mỗi thành phần liên thông của rừng 
này là một cây khung. Muốn thêm một cạnh (lí, v) vào T mà không tạo thảnh 
chu trình đơn thì (lí, v) phải nối hai cây khác nhau của rừng T. Điều này làm 
chúng ta nghĩ đến cấu trúc dữ liệu biếu diễn các tập rời nhau: Ban đầu ta khởi 
tạo n tập S 1 ,S 2 , ■■■ ,S n , mỗi tập chứa đúng một đỉnh của đồ thị. Khi xét tới cạnh 
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(u, v), nếu u và V thuộc hai tập khác nhau S u , S v thì ta hợp nhất S u , S v lại thành 
một tập. 

Vậy có hai thao tác cần phải cài đặt hiệu quả trong thuật toán Kruskal: phép 
kiểm tra hai đỉnh có thuộc hai tập khác nhau hay không và phép hợp nhất hai 
tập. Một trong những cấu trúc dữ liệu hiệu quả để cài đặt những thao tác này là 
rừng các tập rời nhau (disịoint-set Ịorest). cấu trúc dữ liệu này đuợc cài đặt nhu 
sau: 

Mồi tập S[. ] đuợc biếu diễn bởi một cây, trong đó mỗi đỉnh trong tập tuong ứng 
với một nút trên cây. Cây đuợc biểu diễn bởi mảng con trỏ tới nút cha: lab[v ] là 
nút cha của nút V. Trong truờng hợp V là nút gốc của cây, ta đặt: 

lab [i?] := —hạng của cây 

Hạng ( rank ) của một cây là một số nguyên không nhỏ hon độ cao của cây. Ban 
đầu mồi tập S[. ] chỉ gồm một đỉnh, nên họ các tập s 1 ,s 2 , —,S n đuợc khởi tạo 
với các nhãn lab[v] ■— 0, \/v G V tuong ứng với một rừng gồm n cây độ cao 0. 

Đe xác định hai đỉnh u, V có thuộc 2 tập khác nhau hay không, ta chỉ cần xác 
định xem gốc của cây chứa lí và gốc của cây chứa V có khác nhau hay không. 
Việc xác định gốc của cây chứa lí đuợc thực hiện bởi hàm FindSet(u ): Đi từ lí 
lên nút cha, đến khi gặp nút gốc (nút r có lab[r] < 0) thì dừng lại. Đi kèm với 
hàm FindSet(u ) là phép nén đuờng (path compressỉon ): Dọc trên đuờng đi từ lí 
tới nút gốc r, đi qua đỉnh nào ta cho luôn đỉnh đó làm con của r: 

function FindSet(u: Integer): Integer; 

//Xác định gốc cây chứa đỉnh u 

begin 

if lab[u] <= 0 then Result := u 

//u là gốc của một tập S[.J nào đó, trả về chính u 
else //u không phải gốc 

begin 

Result := FindSet (lab [u] ) ; //Gọi đệ quy úm gốc 
lab [u ] : = Result ; //Nén đường, cho u làm con của nút gốc luôn 

end; 

end; 
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Việc hợp nhất hai tập tức là xây dựng cây mới chứa tất cả các phần tử trong hai 
cây ban đầu. Giả sử r và s là gốc của hai cây tương ứng với hai tập cần hợp 
nhất. Khi đó: 

• Neu cây gốc r có hạng cao hơn cây gốc s, ta cho s làm con của r, hạng của 
cây gốc r không thay đối, tương tự cho trường hợp cây gốc r thấp hơn cây 
gốc s. 

• Neu hai cây ban đầu có cùng hạng, ta cho cây gốc r làm con của gốc s khi 
đó cây gốc s có thể sẽ bị tăng độ cao, do vậy để họp lý hóa ta tăng hạng của 
s lên 1, tương đương với việc giảm lab[s] đi 1. 

procedure Union (r, s: Integer) ; //Hợp nhất hai tập r và s 

begin 

if lab[r] < lab[s] then //hạng của r lớn hơn 
1 ab [ s ] : = r //cho s làm con cùa r 

else 

begin 

if lab[r] = lab[s] then Dec(lab[s]); 

//Nếu hai tập bằng hạng, tăng hạng của s 
1 ab [ r ] : = s ; //Clio r làm con của s 

end; 

end; 

Hình 2.4 mô tả hai cây biểu diễn hai tập rời nhau, sau khi xét tới một cạnh (u, v) 
nối giữa hai tập, hai cây được hợp nhất lại bằng cách cho một cây làm cây con 
của gốc cây kia. 




Hình 2.4. Hai tập rời nhau được hợp nhất lại khi xét tới một cạnh nối một đỉnh của tập này với một 

đỉnh của tập kia 

H KRUSKAL.PAS V Thuật toán Kruskal 

{$MODE OBJFPC} 

program MinimumSpanningTree; 
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const 

maxN = 1000; 

maxM = maxN * (maxN - 1) div 2; 

type 

TEdge = record //cấu trúc cạnh 

X, ỵ: Integer; //Hai đỉnh đầu mút 
w : Integer; //Trọngsố 

Selected: Boolean; //Đánh dấu chọn/không chọn vào cây khung 
end; 
var 

lab: array [ 1. .maxN] of Integer; //Nhãn của disjoint setforest 
e: array [ 1. .maxM] of TEdge; //Danhsách cạnh 
n, m, k: Integer; 
procedure Enter; //Nhập dữ liệu 
var i: Integer; 
begin 

ReadLn(n, m); 

f or i := 1 to m do 
with e[i] do 
begỉn 

ReadLn(x, y, w); 

Selected := False; //Chưa chọn cạnh nào 

end; 

for i := 1 to n do lab[i] := 0; 

//Khởi tạo n tập rời nhau hạng của moi tập bằng 0 
k : = 0 ; //Biến đếm số cạnh được kết nạp vào cây khung 
end; 

íunction FindSet(u: Integer) : Integer; //Xác định tập chứa đỉnh u 

begin 

if lab[u] <= 0 then Result := u //u là gốc của một tập S[.] nào đó 
else //u không phải gốc 
begin 

Result := FindSet (lab [u] ) ; //Gọi đệ quy tìm gốc 
1 ab [ u ] : = Result; //Nén đường 

end; 

end; 

procedure Union (r, s: Integer) ; //Hợp nhất hai tập r và s 

begin 
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if lab[r] < lab[s] then //hạng của r lớn hon 
1 ab [ s ] : = r //cho s làm con của r 

else 

begin 

if lab[r] = lab[s] then Dec(lab[s]); 

//Neu hai tập bằng hạng, tăng hạng của s 
1 ab [ r ] : = s ; //Cho r làm con của s 

end; 

end; 

procedure ProcessEdge (var e: TEdge) ; //Xử lý một cạnh e 
var r, s: Integer; 

begin 

with e do 
begin 

r := FindSet (x) ; 

s := FindSet(ỵ); //Xác định 2 tập tương úng với 2 đầu mút 
if r <> s then //Hai đầu mút thuộc hai tập khác nhau 
begin 

Selected : = True ; //Cạnh e sẽ được chọn vào cây khung nhỏ nhất 
I nc ( k ) ; //Tăng biến đếm so cạnh được kết nạp 
Union(r, s); //Hợp nhất hai tập thành một 
end; 

end; 

end; 

procedure QuickSort (L, H: Integer) ; //Xử lý danh sách cạnh e[L...H] 
var 

i, j: Integer; 
pivot: TEdge; 

begin 

//Nếu cây đã có đủ k cạnh hoặc danh sách cạnh rỗng thì thoát luôn 

if (L > H) or (k = n - 1) then Exit; 

//Chúý L > H, không phải L > H như trong QuickSort 

i := L + Random(H - L + 1); 
pivot := e [ i]; 
e [i] : = e [L] ; 

i : = L; 
j := H; 
repeat 
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while (e[j].w > pivot.w) and (i < j) do Dec(j); 

if i < j then 
begỉn 

e [ i ] : = e [ j ] ; 

Inc(i); 

end 

else Break; 

whỉle (e[i].w < pivot.w) and (i < j) do Inc(i); 

if ỉ < j then 
begin 

e [ j ] : = e [ i ] ; 

Dec (j); 

end 

else Break; 
until i = j; 

QuickSort(L, i - 1); 

//Các cạnh e[L...i -1] có trọng số <Pivot.w, gọi đệ quy xử lý trước 

e[i] := Pivot; 

if k < n - 1 then ProcessEdge (e [ i ] ) ; //Xửlý tiếp cạnh efij = Pivot 
QuickSort (i + 1, H); 

//Các cạnh e[i + 1...H] có trọng số > Pivottv, gọi đệ quy xử lý sau 

end; 

procedure PrintResult; 

var 

i, Weight: Integer; 

begin 

if k < n - 1 then //Không kết nạp đủ n - 1 cạnh, đỗ thị không liên thông 
WriteLn('Graph is not connected!') 

else //In ra cây khung nhỏ nhất 
begln 

WriteLn('Minimum Spanning Tree:'); 

Weight := 0; 

for i := 1 to m do 
with e[i] do 

if Selected then //In ra cách cạnh được đánh dấu chọn 

begin 

WriteLn('(', X, , y, ') = ', w); 

Inc(Weight, w); 
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end; 

WriteLn( 

'Weight = Weight); 

end; 


end; 


begin 


Enter; 


QuickSort(1, 

m) ; //Lồng thuật toán Kruskal vào QuickSort 

PrintResult; 


end. 



Tính đúng đắn của thuật toán Kruskal được suy ra từ Định lý 3-17: Đe ý rằng 
các cạnh được kết nạp vào cây khung sau mỗi bước sẽ tạo thành một rừng (đồ 
thị không có chu trình đon). Mồi khi cạnh ( u , v) được xét đến, nó sẽ chỉ được 
kết nạp vào cây khung nếu như u và V thuộc hai cây (hai thành phần liên thông) 
Ty, Ty khác nhau. Ký hiệu A là tập cạnh của T u , khi đó lát cắt V — Ty u (y — Ty) 
là tưong thích với tập A, (lí, v) là cạnh nhẹ của lát cắt nên (lí, v) cũng phải là 
một cạnh trên một cây khung nhỏ nhất. 

c) Thời gian thực hiện giải thuật 

Với hai số tự nhiên m, n, hàm Ackermann A(m, rì) được định nghĩa như sau: 

{ n + 1, nếu m — 0 
A(m — 1,1), nếu m > 0 và n — 0 
rì(m — 1 ,A(m,n — 1)), nếum > 0 vàn > 0 

Dưới đây là bảng một số giá trị hàm Ackermann: 
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X \ n: 

m: 

0 

1 

2 

3 

4 

0 

1 

2 

3 

4 

5 

1 

2 

3 

4 

5 

6 

2 

3 

5 

7 

9 

11 

3 

5 

13 

29 

61 

125 

4 

13 

65533 

265536 _ 2 

^2 65536 2 

OÓ5536 

2 2 -3 


Hàm A(m, rì) là một hàm tăng rất nhanh theo đối số n. Có thể chứng minh được 


A(0,n) — n + 1 
A(l,n) = n + 2 
A(2,n) = 2n + 3 
A(3,n) = 2 n+3 - 3 
A(A,n)= 2^ -3 

n+3 lũy thừa 

Chẳng hạn A( 4,2) là một số có 19729 chữ số, A(4,4) là một số mà số chữ số của 
nó lớn hơn cả số nguyên tử trong phần vũ trụ mà con người biết đến. 

Khi n > 0, xét hàm a(m,n), gọi là nghịch đảo của hàm Ackerman, định nghĩa 
như sau: 

a(m,n) — min ịk > 1: A (ji, Ị—> lgnỊ 

Người ta đã chứng minh được rằng với cấu trúc dữ liệu rừng các tập rời nhau, 
việc thực hiện m thao tác FindSet và Union mất thời gian 0(ma(m,n)). Ở đây 
a(m,n) là một hằng số rất nhỏ (trên tất cả các dữ liệu thực thế, không bao giờ 
a(jn, rì) vượt quá 4). Điều đó chỉ ra rằng ngoại trừ việc sắp xếp danh sách cạnh, 
thuật toán Kruskal ở trên có thời gian thực hiện 0(|£'|a(|£'|, |1/|)). 

Tuy nhiên nếu phải thực hiện sắp xếp danh sách cạnh, chúng ta cần cộng thêm 
thời gian thực hiện giải thuật sắp xếp 0(|£'| lglEl) nữa. 
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2.3. Thuật toán Prim 

a) Tư tưởng của thuật toán 

Trong trường hợp đồ thị dày (có nhiều cạnh), có một thuật toán hiệu quả hon để 
tìm cây khung ngắn nhất là thuật toán Prim [32]. Với một cây khung T và một 
đỉnh V Ệ. T, ta gọi khoảng cách từ V tới T, ký hiệu d[v], là trọng số nhỏ nhất của 
một cạnh nối V với một đỉnh nằm trong T : 

d[v] — min{w(it, v)} 

UET 

Tư tưởng của thuật toán có thế trình bày như sau: Ban đầu khởi tạo một cây T 
chỉ gồm 1 đỉnh bất kỳ của đồ thị, sau đó ta cứ tìm đỉnh gần T nhất (có khoảng 
cách tới T ngắn nhất) kết nạp vào T và kết nạp luôn cạnh tạo ra khoảng cách gần 
nhất đó, cứ làm như vậy cho tới khi: 

• Hoặc đã kết nạp đủ n đỉnh vào T, ta có một cây khung ngắn nhất. 

• Hoặc chưa kết nạp đủ n đỉnh nhưng không còn cạnh nào nối một đỉnh trong 
T với một đỉnh ngoài T. Ta kết luận đồ thị không liên thông và không thể 
tồn tại cây khung. 

b) Kỹ thuật cài đặt 

Khi cài đặt thuật toán Prim, ta sử dụng các nhãn khoảng cách d[v ] để lưu 
khoảng cách từ V tới T tại mỗi bước. Mồi khi cây T bố sung thêm một đỉnh u, ta 
tính lại các nhãn khoảng cách theo công thức sau: 

d[v] mới ■= min { d[v] cũ ,w(u,v )} 

Tính đúng đắn của công thức có thể hình dung như sau: d[v ] là khoảng cách từ 
V tới cây T, theo định nghĩa là trọng số nhỏ nhất trong số các cạnh nối V với một 
đỉnh nằm trong T. Khi cây T “nở” ra thêm đỉnh lí nữa mà đỉnh lí này lại gần V 
hon tất cả các đỉnh khác trong T, ta ghi nhận khoảng cách mới d[v] là trọng số 
cạnh ( u, v), nếu không ta vẫn giữ khoảng cách cũ. 
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Hình 2.5. Cơ chế cập nhật nhãn khoảng cách 


Tại mồi bước, đỉnh ngoài cây có nhãn khoảng cách nhỏ nhất sê được kết nạp vào 
cây, sau đó các nhãn khoảng cách được cập nhật và lặp lại. Mô hình cài đặt của 
thuật toán có thế viết như sau: 

u := «Một đỉnh bất kỳ»; 

T := {u}; 

for Vv Ể T do d[v] := +°°; 

//Các đỉnh ngoài T được khởi tạo nhãn khoảng cách +CO 

for i : = 1 to n - 1 do //Làmn-llần 

begin 

for (Vv Ể T: (u, v) EE) do 

d[v] := min{d[v], w (u, v) }; 

//Cập nhật nhãn khoảng cách của các đỉnh kể u nằm ngoài T 

u := arg min{d[v]:v Ể T}; 

//Chọn u là đính có nhãn khoảng cách nhỏ nhất trong số các đỉnh nằm ngoài T 

if d [u] = +°° then //Đồ thị không liên thông 

begin 

Output <— "Không tồn tại cây khung"; 

Break; 

end; 

T : = T U { u } ; //Bổ sung II vào T 

end; 

Output <— T; 

Cài đặt dưới đây sử dụng ma trận trọng số đế biểu diễn đồ thị. Kỳ thuật đánh 
dấu được sử dụng đế biết một đỉnh V đang nằm ngoài (outsideịv] — True ) hay 
nằm trong cây T ( outsideịy ] = False ). Ngoài ra đế tiện lợi hon trong việc chỉ 
ra cây khung nhỏ nhất, với mỗi đỉnh V nằm ngoài T ta lưu lại trace [v] là đỉnh u 
nằm trong T mà cạnh (lí, v) tạo ra khoảng cách gần nhất từ V tới T: w(u, V ) = 
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d[v]. Khi thuật toán kết thúc, các cạnh trong cây khung là những cạnh 
(i traceịv ], ỳ). 

H PRIM.PAS s Thuật toán Prim 


{$MODE OBJFPC} 

program MinimumSpanningTree; 

const 

maxN = 1000; 
maxW = 1000; 

var 

w: array [ 1. .maxN, l..maxN] of Integer; //Ma trận trọng số 
d: array [ 1. .maxN] of Integer; //Các nhăn khoảng cách 
outside: array [ 1. .maxN] of Boolean; //Đánh dấu các đỉnh ngoài cây 
trace: array [ 1. .maxN] of Integer; //vết 
n: Integer; 
procedure Enter; 
var 

i, m, u, v: Integer; 

begin 

ReadLn(n, m); 

for u := 1 to n do 

for V : = 1 to n do w[u, v] := maxW + 1; 

//Khởi tạo ma trận trọng số vói các phần tử +CO 

for i := 1 to m do 
begin 

ReadLn(u, V, w[u, v] ); 

//Chú ỷ: Đơn đồ thị mới có thế đọc dữ liệu thế này 
w[v, u] := w[u, v] ; //Đồ thị vô hướng 

end; 

end; 

íunction Prim : Boolean; //Thuật toán Prim, trả về True nếu tìm được cây khung 

var 

u, V, dmin, i: Integer; 

begin 

u : = 1 ; //Cây ban dầu chỉ gằm dinh 1 

for V : = 2 to n do d [v] := maxW + 1; 

//Nhãn khoảng cách cho các đĩnh ngoài cây khỏi tạo bằng +CO 

FillChar(outside[2], 
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(n - 1) * SizeOf(outside[2]), 

True) ; //Đánh dấu các đỉnh 2...n nam ngoài cây 
outside [1] : = False; //Đỉnh 1 nằm trong cây 

for i : = 1 to n - 1 do //Làmn-llần 

begin 

//Trước hết tính lại các nhãn khoảng cách 

for V := 1 to n do 

if outside[v] and (d[v] > w[u, v]) then 
//Cạnh (u, v) tạo khoảng cách ngắn hơn khoảng cách cũ 

begin 

d [ V ] := w [u, V ] ; //Cập nhật nhãn khoảng cách 

trace [v] := u; //Lưu vết 

end; 

//Tìm đỉnh u ngoài cây có nhãn khoảng cách nhỏ nhất 

dmin := maxW + 1; 
u : = 0; 

for V := 1 to n do 

if outside[v] and (d[v] < dmin) then 
begin 

dmin := d[V]; 
u : = V ; 

end; 

if u = 0 then Exit(False); 

//Cây không có cạnh nào nối ra ngoài, đồ thị không liên thông, thoát 
outside[u] := False; //Kết nạp u vào cây 

end; 

Result := True; 

end; 

procedure PrintResult ; //ỉn kết quả trong trường hợp tìm ra cây khung nhỏ nhất 

var 

V, Weight: Integer; 

begin 

WriteLn('Minimum Spanning Tree:'); 

Weight := 0; 

for V := 2 to n do 
begin 

WriteLn ( ' ( ' , trace[v] , ', ', V, ') = ', 

w [trace[v], v]) ; 

Inc(Weight, w[trace[v], v]); 
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end; 

WriteLn('Weight = Weight); 

end; 

begin 

Enter; 

if Prim then PrintResult 

else WriteLn('Graph is not connected!'); 

end. 

Tính đúng đắn của thuật toán Prim cũng dề dàng suy ra được từ Định lý 3-17: 
Gọi A là tập cạnh của cây T tại mỗi bước, xét lát cắt tách tập đỉnh V làm 2 tập 
rời nhau, một tập gồm các đỉnh G T và tập còn lại gồm các đỉnh Ệ- T. Đỉnh V 
được kết nạp vào cây T tại mỗi bước tưong ứng với cạnh Ợraceịv], v) là cạnh 
nhẹ của lát cắt nên nó là an toàn với tập A, việc bổ sung cạnh này vào A vẫn đảm 
bảo A là tập con của tập cạnh một cây khung ngắn nhất. 

c) Thời gian thực hiện giải thuật 

Chưong trình cài đặt thuật toán Prim ở trên có thời gian thực hiện 0(n 2 ), hiệu 
quả hon thuật toán Kruskal trong trường hợp đồ thị dày nhưng lại kém hon nếu 
đồ thị thưa. Trong trường hợp đồ thị thưa, ta có thể cải tiến mô hình cài đặt thuật 
toán Prim bằng cách kết hợp với một hàng đợi ưu tiên chứa các đỉnh ngoài cây 
có nhãn khoảng cách < + 00 . Hàng đợi ưu tiên cần hồ trợ các thao tác sau: 

• Extract : Lấy ra một đỉnh ưu tiên nhất (đỉnh u có d[u] nhỏ nhất) khỏi hàng 
đợi ưu tiên. 

• Update(v ): Thao tác này báo cho hàng đợi ưu tiên biết rằng nhãn d[v] đã 
bị giảm đi, cần tổ chức lại (thêm V vào hàng đợi ưu tiên nếu V đang nằm 
ngoài). 

Khi đó thuật toán Prim có thể viết theo mô hình mới: 

T := {Một đỉnh bất kỳ u}; 
for Vv ỂT do d[v] := +°°; 

//Các đỉnh ngoài T được khởi tạo nhãn khoảng cách +00 
PQ : = 0; //Hàng đợi ưu tiên được khởi tạo rỗng 

f or i : = 1 to IVI - 1 do //Làm n-llần 
begin 

for (Vv G V : (u, v)£E) do //Cập nhật nhãn các đỉnh ngoài cây kể với u 
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if (v Ể T) and (d[v] > w(u, v)) then 
begin 

d [v] : = w (u, v) ; 

Update(v); 

end; 

if PQ = 0 then //Đồ thị không liên thông 

begin 

Output <— "Không tồn tại cây khung"; 

Break; 

end; 

u := Extract; 

//Chọn u là đỉnh có nhãn khoảng cách nhỏ nhất trong số các đính nằm ngoài T 
T : = T u { u } ; //Bổ sung u vào T 

end; 

Thời gian thực hiện giải thuật có thế ước lượng theo số lời gọi Update và 
Extract. Tương tự như thuật toán Dijkstra, có thể thấy rằng chúng ta cần sử 
dụng không quá n — 1 lời gọi Extract và không quá m lời gọi Update với n là 
số đỉnh và m là số cạnh của đồ thị. 

Một số cấu trúc dữ liệu biếu diễn hàng đợi ưu tiên có thế sử dụng đế cải thiện 
tốc độ thuật toán Prim trong trường hợp đồ thị thưa. Chang hạn nếu sử dụng 
Fibonacci Heap làm hàng đợi ưu tiên, thời gian thực hiện giải thuật là 
0(|k|lg|k| + |£|). Mặc dù vậy cần nhấn mạnh rằng trong các ứng dụng thực tế 
mà danh sách cạnh có thế được sắp xếp trong thời gian 0(|£'|) (chang hạn dùng 
các thuật toán sắp xếp cơ số hoặc đếm phân phối), thuật toán Kruskal luôn là sự 
lựa chọn hợp lý hơn cả vì nó có thế tìm được cây khun trong thời gian 
0(\E\a(\E\,\V\')). 


Bài tập 

2.16. Cho T là cây khung nhỏ nhất của đồ thị G và (lí, V ) là một cạnh trong T. 
Chứng minh rằng nếu ta trừ trọng số cạnh (lí, v) đi một số dương thì T vẫn 
là cây khung nhỏ nhất của đồ thị G. 


168 



2.17. Cho G là một đồ thị vô hướng liên thông, c là một chu trình trên G và e là 
cạnh trọng số lớn nhất của c. Chứng minh rằng nếu ta loại bỏ cạnh e khỏi 
đồ thị thì không ảnh hưởng tới trọng số của cây khung nhỏ nhất. 

2.18. Chứng minh rằng đồ thị có duy nhất một cây khung nhỏ nhất nếu với mọi 
lát cắt của đồ thị, có duy nhất một cạnh nhẹ nối hai tập của lát cắt. Cho 
một ví dụ đế chỉ ra rằng điều ngược lại không đúng. 

2.19. Gọi T là một cây khung nhỏ nhất của đồ thị vô hướng liên thông G, ta 
giảm trọng số của một cạnh không nằm trong cây T, hãy tìm một thuật 
toán đon giản để tìm cây khung của đồ thị mới. 

Gợi ỷ: Gọi cạnh bị giảm trọng số là (u, v), thêm (li, v) vào T ta sẽ được 
đúng một chu trình đơn, loại bỏ cạnh trọng số lớn nhất trên chu trình đơn 
này sẽ được cây khung nhỏ nhất của đồ thị mới. 

2.20. Giả sử rằng đồ thị vô hướng liên thông G có cây khung nhỏ nhất T, người 
ta thêm vào đồ thị một đỉnh mới và một số cạnh liên thuộc với đỉnh đó. 
Tìm thuật toán xác định cây khung nhỏ nhất của đồ thị mới. 

2.21. Giáo sư X đề xuất một thuật toán tìm cây khung ngắn nhất dựa trên ý 
tưởng chia để trị: Với đồ thị vô hướng liên thông G — ( y,E ), phân hoạch 
tập đỉnh V làm hai tập rời nhau Vị, v 2 mà lực lượng của hai tập này hon 
kém nhau không quá 1. Gọi E -1 là tập các cạnh chỉ liên thuộc với các đỉnh 
G v t và E 2 là tập các cạnh chỉ liên thuộc với các đỉnh G v 2 . Tìm cây khung 
nhỏ nhất trên đồ thị G Ấ — (y lt E i) và G 2 — ( v 2 , E 2 ) bằng thuật toán đệ quy, 
sau đó chọn cạnh trọng số nhỏ nhất nối V-1 với v 2 đế nối hai cây khung tìm 
được thành một cây. Chứng minh tính đúng đắn của thuật toán hoặc chỉ ra 
một phản ví dụ cho thấy thuật toán sai. 

2.22. (Cây khung nhỏ thứ nhì) Cho G — (y, E,w ) là đồ thị vô hướng liên thông 
có trọng số, giả sử rằng \E\ > |h| và các trọng số cạnh là hoàn toàn phân 
biệt (w là đon ánh). Gọi T là tập tất cả các cây khung của G và A là cây 
khung nhỏ nhất của G, khi đó cây khung nhỏ thứ nhì được định nghĩa là 
cây khung B G T thỏa mãn: 

w(B ) = min (w(r)} 

TeT-ịA} 
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• Chỉ ra rằng đồ thị G có duy nhất một cây khung nhỏ nhất là A, nhung có thế 
có nhiều cây khung nhỏ thứ nhì. 

• Chứng minh rằng luôn tồn tại một cạnh (u, v) G A và (x, y) Ệ. A đế nếu ta 
loại bỏ cạnh (lí, v) khỏi A rồi thêm cạnh (x, y) vào A thì sẽ đuợc cây khung 
nhỏ thứ nhì. 

• Với Vit, V G V, gọi f[u, V ] là cạnh mang trọng số lớn nhất trên đuờng đi duy 
nhất từ lí tới V trên cây A. Tìm thuật toán 0(1 k| 2 ) để tính tất cả các / [lí, v], 
Vu,v G V. 

• Tìm thuật toán hiệu quả đế tìm cây khung nhỏ thứ nhì của đồ thị. 

2.23. Cho s và t là hai đỉnh của một đồ thị vô huớng có trọng số G — (V, E, w). 
Tìm một đuờng đi từ s tới t thỏa mãn: Trọng số cạnh lớn nhất đi qua trên 
đuờng đi là nhỏ nhất có thế. 

Gợi ỷ: Có rất nhiều cách làm: Ket hợp một thuật toán tìm kiếm trên đồ thị 
với thuật toán tìm kiêm nhị phân, hoặc sửa đối thuật toán Dỉjkstra, hoặc 
sử dụng thuật toán tìm cây khung ngắn nhất. 

2.24. (Euclidean Minimum Spanning Tree) Trong truờng hợp các đỉnh của đồ 
thị đầy đủ đuợc đặt trên mặt phang trực chuẩn và trọng số cạnh nối giữa 
hai đỉnh chính là khoảng cách hình học giữa chúng. Nguời ta có một phép 
tiền xử lý để giảm bớt số cạnh của đồ thị bằng thuật toán tam giác phân 
Delaunay (O(nlgn)), đồ thị sau phép tam giác phân Delaunay sẽ còn 
không quá 3 n cạnh, do đó sẽ làm các thuật toán tìm cây khung nhỏ nhất 
hoạt động hiệu quả hon. Hãy tự tìm hiểu về phép tam giác phân Delaunay 
và cài đặt chuông trình đế tìm cây khung nhỏ nhất. 

2.25. Trên một nền phang với hệ toạ độ trực chuẩn đặt n máy tính, máy tính thứ 
i đuợc đặt ở toạ độ (Xj,y Ể ). Đã có sẵn một số dây cáp mạng nối giữa một 
số cặp máy tính. Cho phép nối thêm các dây cáp mạng nối giữa từng cặp 
máy tính. Chi phí nối một dây cáp mạng tỉ lệ thuận với khoảng cách giữa 
hai máy cần nối. Hãy tìm cách nối thêm các dây cáp mạng đế cho các máy 
tính trong toàn mạng là liên thông và chi phí nối mạng là nhỏ nhất. 

2.26. Hệ thống điện trong thành phố đuợc cho bởi n trạm biến thế và các đuờng 
dây điện nối giữa các cặp trạm biến thế. Mồi đuờng dây điện e có độ an 
toàn là p(e) G (0,1]. Độ an toàn của cả luới điện là tích độ an toàn trên các 
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đường dây. Hãy tìm cách bỏ đi một số dây điện đế cho các trạm biến thế 
vẫn liên thông và độ an toàn của mạng là lớn nhất có thể. 

Gợi ỷ: Bằng kỹ thuật lấy logarithm, độ an toàn trên lưới điện trở thành 
tổng độ an toàn trên các đường dây. 

3. Luồng cực đại trên mạng 

3.1. Các khái niệm và bài toán 
a) Mạng 

Mạng ựlow network ) là một bộ năm G — (y, E, c, s, t), trong đó: 

V và E lần lượt là tập đỉnh và tập cung của một đồ thị có hướng không có 
khuyên (cung nối từ một đỉnh đến chính nó). 

s và t là hai đỉnh phân biệt thuộc V, s gọi là đỉnh phát ( source ) và t gọi là đỉnh 
thu ( sink ). 

c là một hàm xác định trên tập cung E: 

c:E —» [0, + 00 ) 
e I—> c(e) 

gán cho mỗi cung e E E một số không âm gọi là sức chứa (capacity)* c(e) > 0. 

Bằng cách thêm vào mạng một số cung có sức chứa 0, ta có thể giả thiết rằng 
mỗi cung e — (u,v) E E luôn có tuông ứng duy nhất một cung ngược chiều, ký 
hiệu - e — (v, ù) E E, gọi là cung đoi của cung e, ta cũng coi e là cung đối của 
cung — e (tức là - (—e) = e). Có thế thấy rằng số cung cần thêm vào mạng là 
một đại lượng 0 (£■). 

Chú ý rằng mạng là một đa đồ thị, tức là giữa hai đỉnh có thế có nhiều cung 
nối. 

Đe thuận tiện cho việc trình bày, ta quy ước các ký hiệu sau: 


Từ này còn có thế dịch là “khả năng thông qua” hay “lưu lượng” 
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Với X, Y là hai tập con của tập đỉnh V và /: E -* R là một hàm xác định trên tập 
cạnh E: 

Ký hiệu {X -» Y} là tập các cung nối một từ một đỉnh thuộc X tới một đỉnh thuộc 
Y: 

{X -> Y} = (e = (u, v) G E:u G x,y E Y} 

Ký hiệu f(x, Y) là tổng các giá trị hàm / trên các cung e G {X -» Y}: 

f(x, Y) = ^ /00 

eex->Y 

b) Luồng 

Luồng ịflow) trên mạng G là một hàm: 

f:E —> E 
e 1-» /(e) 

gán cho mỗi cung e một số thực /(e), gọi là luồng trên cung e, thỏa mãn ba 
ràng buộc sau đây: 

• Ràng buộc về sức chứa ( Capacity constraint): Luồng trên mỗi cung không 
đuợc vượt quá sức chứa của cung đó: Ve G E:f(e ) < c(e). 

• Ràng buộc về tính đối xứng lệch ( Skew symmetry ): Với Ve G E, luồng trên 
cung e và luồng trên cung đối —e có cùng giá trị tuyệt đối nhưng trái dấu 
nhau: Ve G E\f(jè) — —/(—e). 

• Ràng buộc về tính bảo tồn (. Flow conservation ): Với mồi đỉnh V không phải 
đỉnh phát và cũng không phải đỉnh thu, tổng luồng trên các cung đi ra khỏi 
V bằng 0: Vu G V — (s, t}: f({v}, V ) = 0. 

Từ ràng buộc về tính đối xứng lệch và tính bảo tồn, ta suy ra được: Với mọi đỉnh 
V E V — {s,t}, tổng luồng trên các cung đi vào V bằng 0: f(y, { V }) = 0. 

Giá trị của luồng / trên mạng G được định nghĩa bằng tống luồng trên các cung 
đi ra khỏi đỉnh phát: 

\f\=fttslV) (3.1) 
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Bài toán luồng cực đại trên mạng (maximum-flow problem ): Cho một mạng G 
với đỉnh phát s và đỉnh thu t, hàm sức chứa c, hãy tìm một luồng có giá trị lớn 
nhất trên mạng G. 

c) Luồng dương 

Luồng dương (positive flow ) trên mạng G là một hàm 

(p-.E —> [0, +oo) 
e I—> <p(e) 

gán cho mỗi cung e một số thực không âm <p(e) gọi là luồng duong trên cung e 
thỏa mãn hai ràng buộc sau đây: 

• Ràng buộc về sức chứa ( Capacỉty constraint ): Luồng duong trên mồi cung 
không được vượt quá sức chứa của cung đó: Ve G E\ 0 < <p(e) < c(e). 

• Ràng buộc về tính bảo tồn ( Flow conservation ): Với mỗi đỉnh V không phải 
đỉnh phát và cũng không phải đỉnh thu, tống luồng dưong trên các cung đi 
vào V bằng tổng luồng dưong trên các cung đi ra khỏi v: Vv E V — (s, t}: 
(p(y,{v}) = (p({v},V). 

Giá trị của một luồng dưong được định nghĩa bằng tổng luồng dưong trên các 
cung đi ra khỏi đỉnh phát trừ đi tổng luồng dưong trên các cung đi vào đỉnh 
phát*: 


\(p\ = (piísịv) - (p(y,{s}) (3.2) 



Hình 2.6. Mạng với các sức chứa trên cung (1 phát, 6 thu) và một tuồng dương với giá trị 7 


Một số tài liệu khác đưa vào thêm ràng buộc: đỉnh phát s không có cung đi vào và đỉnh thu í không có 
cung đi ra. Khi đó giá trị luồng dương bằng tống luồng dương trên các cung đi ra khỏi đỉnh phát. Cách 
hiếu này có thế quy về một trường hợp riêng của định nghĩa. 
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d) Mối quan hệ giữa luồng và luồng dương 
BỖ đề 3-1 

Cho cp\ E -* M là một luồng dương trên mạng G — (y, E, c, s, t). Khi đó hàm 

f:E —> R 

e •-» /(e) = (p(e) - <p(-e) 

là một luồng trên mạng ổ và l/l = |<p| 

Chứng minh 

Trước hết ta chứng minh / thỏa mãn tất cả các ràng buộc về luồng: 

Ràng buộc về sức chứa: Với Ve £ E: 

/(e) = <p(e) — (p(—e) < cp(e) < c(ụ,v ) 

>0 

Ràng buộc về tính đối xứng lệch: Với Ve £ E 

/(e) = <p(e) - <pi-è) 

= -(<?(-»-< p(e)) 

= -/(-» 

Ràng buộc về tính bảo tồn: Vt7 £ V, ta có: 


/({»,10 = ^ (<K» - íP(-e)) 

ee{{v)->v} 

= Ị ^ <K» 1 - Ị ^ íP(-e) Ị 


\ee{{r}-*y} / \-ee{V-> 


<p(-è) 


«} 


= (p({v},V) - (ọ{V,{vỴ) 

Neu V V s và 17 V t, ta có: 

/({»,10 = »{»,») - < p ( v ,{») = 0 

(Do tông luồng dương đi ra khỏi V bằng tông luồng dương đi vào V ) 
Nếu V — s, xét giá trị luồng / 

l/l =/({»,10 = »({»,10 -»»{») = M 

BỔ đề 3-2 

Cho /:£■-» M là một luồng trên mạng G — (y, E, c, s, t). Khi đó hàm: 
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(Ọ\E —* [0, oo) 


e I—> <p(e) = max{/(e),0} = 


/(e),nếu/(e) > 0 
0, nếu/(e) < 0 


là một luồng dương trên mạng và \(p\ = \f\ 


Chứng minh 

Trước hết ta chứng minh (p thỏa mãn các ràng buộc về luồng dương: 

Ràng buộc về sức chứa: Ve GE, rõ ràng (p{è) là số không âm và (p{è) — 
max{/(e),0} < c(e). 

Ràng buộc về tính bảo tồn: Vv £ V, tông luồng dương ra khỏi V trừ tong luồng 
dương đi vào V bằng: 



ee{{v}^v} 

/(e)>0 


ee{y-*{r}} 

/(e)>0 



ee{w->v} 

/(e)>0 


-ee{{v)-*v} 
/(-e)<0 


Nếu V ^ s và V ^ t, R) = 0 nên luồng dương đi vào V (<p({ v}, R)) được bảo 

tồn khi đi ra khỏi V ((ịp(y, {v})). 

Nếu V — s, ta có: 


\<p\ = <pas},v)-<p(y,{s}) = fas} l v') = \f\ 


Bố đề 3-1 và Bố đề 3-2 cho ta một mối tương quan giữa luồng và luồng dương. 
Khái niệm về luồng dương dễ hình dung hơn so với khái niệm luồng, tuy nhiên 
những định nghĩa về luồng tổng quát lại thích hợp hơn cho việc trình bày và 
chứng minh các thuật toán trong bài. Ta sẽ sử dụng luồng dương trong các 
hình vẽ và output (chỉ quan tâm tới các giá trị luồng dương <p(e)), còn các khái 
niệm về luồng sẽ được dùng đế diễn giải các thuật toán trong bài. 

Trong quá trình cài đặt thuật toán, các hàm c và / sẽ được xác định bởi tập các 
giá trị { c[e]} eẸE và {f[e]} eeE nên ta có thế dùng lần các ký hiệu c(e),/(e) (nếu 
muốn đề cập tới giá trị hàm) hoặc c[e],f[e] (nếu muốn đề cập tới các biến số). 

e) Một số tính chất cơ bản 

Cho mạng G — ( V, E, c, s, t ) và một luồng / trên G. Gọi cự., Y) là lưu lượng từ 
X sang Y và f(X,Y) là giá trị luồng từ X sang Y. 
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Định lý 3-3 

Cho / là một luồng trên mạng G — (V, E, c, s, t), khi đó: 

a) vx c V, ta cỏ fỢỉ,X) = 0. 

b) vx, Y c V, ta có fự, Y ) = -f(Ỵ, X ). 

c) VX,Y,Z c V và X n Y = 0, ta có f(x,z) + f(ỵ,z ) = F(x u Y,Z). 

d) vx c V - {s, t}, ta có f[X, V) = 0. 


Chứng minh 

a) \/X E V, ta có: 

/(*.*)= 2 nẻ) 

ee{x-»x} 

như vậy /(e) xuất hiện trong tống nếu và chi nếu /(—e) cũng xuất hiện trong 
tổng. Theo tính đối xứng lệch của luồng: /(e) = — /(— é), ta có f(X,X) = 0. 

b) vx, Y £ V, ta có : 

/0) = - 2 f(-e) = -f(ỵ,x) 

ee{X^Y} -ee{Y->X} 

c) vx, Y,z QV vầX nY = 0, ta có: 

f(XuY,Z) = £ /(e) 

ee{xur-»z} 

/(e)+ 2 /(e) 

ee{X->Z) eẽ(Y^Z} 

7(Cz) 7ÕVÕ 

d) VA' £ V - {s, í}, do 

X = |>) 

UEX 

Nên theo chứng minh phần c): 

f(x l v) = Ỵ j fauịv) 

USX 

Mỗi hạng tử của tống: /({li}, V) chính là tống luồng trên các cung đi ra khỏi đỉnh 
u, do tính bảo tồn luồng và u không phải đỉnh phát cũng không phải đình thu, 
hạng tử này phải bằng 0, suy ra f(x,v) — 0. Từ chứng minh phần b), ta còn suy 
ra f(V, X) = 0 nữa. 



f(x,Y)= ỵ 
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Định lý 3-4 

Giá trị luồng trên mạng bằng tổng luồng trên các cung đi vào đỉnh thu 
Chứng minh 

Giả sử / là một luồng trên mạng G — (y,E,c,s, í), ta có: 

= f(y,V)-f(y-{s},v) 

= -f(V-{s},V) 

= f(y,v-{s }) 

= f(y l {t}) + f(y,v-{s,t}) 

= f(y,{t}) 

Hệ quả 

Giá trị luồng duơng trên mạng bằng tống luồng duơng đi vào đỉnh thu trừ tổng 
luồng duong ra khỏi đỉnh thu. 

f) Mạng thặng dư 

Với / là một luồng trên mạng G — ( V, E, c,s,t). Ta xét mạng Gf cũng là mạng G 
nhưng với hàm sức chứa mới cho bởi: 

Cf\ E —» [0, +oo) 

1 , ' . (3.3) 

e •-» C/O) = c(e) -/0) 

Mạng Gf xây dựng như vậy được gọi là mạng thặng dư ( residuaỉ network ) của 
mạng G sinh ra bởi luồng /. Sức chứa của cung (e) trên Gf thực chất là lượng 
luồng tối đa chúng ta có thể đấy thêm vào luồng /(e) mà không làm vượt quá 
sức chứa c(e). 

Một cung trên G gọi là cung bão hòa (saturated edge) nếu luồng trên cung đó 
đúng bằng sức chứa, ngược lại cung đó gọi là cung thặng dư (resỉdual edge). Ký 
hiệu Ef là tập các cung thặng dư trên mạng thặng dư Gf. Một đường đi chỉ qua 
các cung thặng dư trên Gf gọi là đường thặng dư (residualpath). 

Cung bão hòa của mạng G trên mạng thặng dư sẽ có sức chứa 0, cung này ít có ý 
nghĩa trong thuật toán nên chúng ta sẽ chỉ vẽ các cung thặng dư (G Ef ) trong các 
hình vẽ. 
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Hình 2.7. Một luồng trên mạng (số ghi trẽn các cung là: sức chứatluồng tlưong) và mạng thặng dư 

tương ứng. 


Hình 2.7 là một ví dụ về mạng thặng dư. Như đã quy ước, chúng ta chỉ vẽ các 
luồng dương. Đồ thị có cung (2,4) với sức chứa c(2,4) = 6, tức là phải có cung 
đối (4,2) với c(4,2) = 0. Luồng dương trên cung (2,4) là <p(2,4) = /(2,4) = 5, 
điều này cũng cho biết luồng trên cung (4,2) là /(4,2) = —5 theo tính đối xứng 
lệch. Vậy trên mạng thặng dư, ta có cung (2,4) với sức chứa c(2,4) — /(2,4) = 
6 — 5 = 1 đồng thời có cung (4,2) với sức chứa c(4,2) — /(4,2) = 0 — (—5) = 
5. 

Định lý 3-5 

Cho / là một luồng trên mạng G — (y, E, c, s, t). Khi đó nếu /' là một luồng trên 
Gf thì hàm: 

/ + /':£—> R 

e >-> (/ + Z')(e) = /(e) + /'(e) 
là một luồng trên mạng G với giá trị luồng I/ + /'I = l/l + \ f'\. 

Chứng minh 

Ta chứng minh (/ + /') thỏa mãn ba tính chất của luồng: 

Ràng buộc về sức chứa: Với Ve E E: 

(/ + /')(e)=/(e)+/'(e) 

< /(e) + (c(e) — /(e)) 

= c(e) 

Tính đối xứng lệch: Với Ve £ E: 

(/ + f)(e) = /(e)+/'(e) 

= -n-ẽ)-n-è) 
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= -(/(-<?) + /'(-e)) 

= -(/ + /')(-e) 

Tính bảo tồn: Với Vu £ 1/, tong luồng / + /' đi ra khỏi u bằng: 

(/ + /')({u},h) = £ (/00+/'00) 

ee{{u}^v} 

/00 + 2 /'00 

es{{u}^>v} es{{u}->v} 

= /({n},R)+/'({u},R) 

Nếu u V s và u V t, ta có (/ + /0(00, V ) = /({u}, k) + /'({u}, k) = 0. 
Thay u = s, ta có 

\f+n = ự+nasịv) = f({s},v)+rttsịv) = 1/1 + \f'\ 

Định lý 3-6 

Cho / và /' là hai luồng trên mạng G = (V, E, c, s, t ) khi đó hàm: 

—> R 

e >-> (/' - /)(e) = /'(e) - /0) 

là một luồng trên mạng thặng dư Gf với giá trị luồng \ f' — f\ — \f'\ — \f\. 

Chứng minh 

Ta chứng minh rằng f'—f thỏa mãn ba tính chất của luồng 
Ràng buộc về sức chứa: Với Ve £ E: 

(/'-/)00=/'00-/00 
^ c(e) -/(e) 

= C/00 

Tính đối xứng lệch: Với Ve £ E: 

(/'-/)00 = /' 00~/00 

= -(/'(-e)-/(-e)) 

= -(/'-/)(-e) 

Tính bảo tồn: Với Vu £ V 

(/'-/XM, V)= ]T (/'(e)-/00) 

/'00- £ /(e) 

eeOHv} ee{{i;Hv} 

= r(W/)-/(W,n 
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Nếu u & s và u & t, ta có (/' - /)({V}, vo = /'({u}, vo - f({v}, V) = 0. 
Thay u = s, ta có 


I/' -/I = (/' -/)({*}, vo = /mvo -/({s},vo = I/'I - I/I 


5.2. Thuật toán Ford-Fulkerson 
a) Đường tăng luồng 

Với / là một luồng trên mạng G — ( V, E, c, s, t). Gọi p là một đường đi đơn từ s 
tới t trên mạng thặng dư Gf . Giả trị thặng dư (resỉdual capacỉty ) của đường p, 
ký hiệu A p, được định nghĩa bằng sức chứa nhỏ nhất của các cung dọc trên 
đường p (xét trên Gf ): 


A p — min{cy(e): (e) nằm trên p} 


Vì các sức chứa cy(e) là số không âm nên A p luôn là số không âm. Neu Ap > 0 
tức là đường đi p là một đường thặng dư, khi đó đường đi p gọi là một đường 
tăng luồng (augmentingpath) tương ứng với luồng /. 

Định lý 3-7 

Cho / là một luồng trên mạng G — ( V, E, c, s,t), p là một đường tăng luồng trên 
Gf. Khi đó hàm fp \ E R định nghĩa như sau: 



(3.4) 


V.0, trường hợp khác 

là một luồng trên Gf với giá trị luồng \fp\ — Ap > 0. 


Chứng minh 

Chúng ta sẽ không chứng minh cụ thế vì việc kiếm chứng fp thỏa mãn ba tính chất 
của luồng khá dễ dàng. Bản chất của luồng fp là đấy một giá trị luồng A p từ s tới t 
dọc theo các cung trên đường p, đồng thời kéo một giá trị luồng - A p từ t về s 
theo hướng ngược lại*. 


Có thế hình dung cơ chế này như một quá trình điện phân: Bao nhiêu ion dương (cation) chuyến đến cực 
âm (catot) t thì cũng phải có bấy nhiêu ion âm (anion) chuyến đến cực dương (anot) s. 
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Định lý 3-5 và Định lý 3-7 cho ta một hệ quả sau: 

Hệ quả 3-8 

Cho / là một luồng trên mạng G — ( V , E, c, s, t ) và p là một đuờng tăng luồng 
trên Gf, gọi fp là luồng trên Gf định nghĩa nhu trong công thức (3.4). Khi đó 
/ + fp là một luồng mới trên G với giá trị I/ + fp\ — l/l + \fp\ — l/l -I- A p. 



Hình 2.8. Tăng luồng dọc đường tăng luồng. 

Hình 2.8 là ví dụ về co chế tăng luồng trên mạng với đỉnh phát 1, đỉnh thu 6 và 
luồng / giá trị 7 (hình a) (chú ý rằng ta chỉ vẽ các luồng duong cho đõ rối). Với 
mạng thặng du Gf (hình b), giả sử ta chọn đuờng đi p — (1,3,4,2,5, 6) làm đuờng 
tăng luồng, giá trị thặng du của p bằng Ap — 2 (sức chứa của cung (3,4)). 
Luồng fp trên Gf sẽ có các giá trị sau: 

/p(l,3) = /p(3,4) = fp( 4,2) = /p( 2,5) = fp{ 5,6) = 2 
/p(3,l) = /p(4,3) = /p(2,4) = /p( 5,2) = /p( 6,5) = -2 

Cộng các giá trị này vào luồng / đang có, ta sê đuợc một luồng mới trên G với 
giá trị 9 (hình c). 

Co chế cộng luồng /p vào luồng / hiện có gọi là tăng luồng dọc theo đường 
tăng luồng p. 
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b) Thuật toán Ford-Fulkerson 

Thuật toán Ford-Fulkerson [14] để tìm luồng cực đại trên mạng dựa trên CO' chế 
tăng luồng dọc theo đuờng tăng luồng. Bắt đầu từ một luồng / bất kỳ trên mạng 
(chắng hạn luồng trên mọi cung đều bằng 0), thuật toán tìm đuờng tăng luồng p 
trên mạng thặng dư, gán f f + fp để tăng giá trị luồng / và lặp lại cho tới khi 
không tìm được đường tăng luồng nữa. 

f := «Một luồng bất kỳ»; 
while «Tìm được đường tăng luồng p» do 
f := f + fp; 

Output <— f; 

c) Cài đặt 

Chúng ta sẽ cái đặt thuật toán Ford-Fulkerson để tìm luồng cực đại trên mạng 
với khuôn dạng Input/Output như sau: 

Input 

• Dòng 1 chứa số đỉnh n < 10 3 , số cung m < 10 5 của mạng, đỉnh phát s, 
đỉnh thu t. 

• m dòng tiếp theo, mỗi dòng chứa ba số nguyên dưong u, V, c tưong ứng với 
một cung nối từ u tới V với sức chứa c < 10 4 . 

Output 

Luồng cực đại trên mạng (như đã quy ước, chỉ đưa ra các luồng dưong trên các 
cung). 
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Sample Input 

Sample Output 

6 8 16 

5 6 6 

4 6 6 

3 5 1 

3 4 3 

2 5 3 

2 4 6 

13 5 

12 5 

Maximum flow: 

e[l] = (5, 6) 

e [2] = (4, 6) 

e[3] = (3, 5) 

e[4] = (3, 4) 

e[5] = (2, 5) 

e[6] = (2, 4) 

e[7] = (1, 3) 

e[8] = (1, 2) 

Value of flow 

c = 6, f = 3 

c = 6, f = 6 

c = 1, f = 1 

c = 3, f = 3 

c = 3, f = 2 

c = 6, f = 3 

c = 5, f = 4 

c = 5, f = 5 
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Đế cài đặt thuật toán được hiệu quả cần có một cơ chế tổ chức dữ liệu hợp lý. 
Chúng ta cần lưu trữ luồng / trên các cung, tìm đường tăng luồng p trên Gf và 
cộng luồng fp vào luồng / hiện có. Việc tìm đường tăng luồng p trên Gf sê được 
thực hiện bằng một thuật toán tìm kiếm trên đồ thị còn việc tăng luồng dọc trên 
đường p đòi hỏi phải tăng giá trị luồng trên các cung dọc trên đường đi đồng 
thời giảm giá trị luồng trên các cung đối. Vậy cấu trúc dữ liệu cần tổ chức để tạo 
điều kiện thuận lợi cho thuật toán tìm đường tăng luồng cũng như dễ dàng chỉ ra 
cung đối của một cung cho trước. 

Đồ thị được biểu diễn bởi danh sách liên thuộc. Tất cả m cung của mạng được 
chứa trong danh sách e[l... m]. Ngoài ra ta thêm m cung đối của chúng với sức 
chứa 0. Các cung đối này được lưu trừ trong danh sách e[—m ... — 1], cung đối 
của cung e[i] là cung e[—i], cung e[0] được sử dụng với vai trò phần tử cầm 
canh và không được tính đến. 

Mồi phần tử của danh sách e là một bản ghi gồm 4 trường (x, y, c, /) trong đó X, 
y là đỉnh đầu và đỉnh cuối của cung, c là sức chứa và / là luồng trên cung. Danh 
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sách liên thuộc được xây dựng bởi hai mảng head[l ...n] và link[—m...m ], 
trong đó: 

• heacL[u] là chỉ số cung đầu tiên trong danh sách liên thuộc các cung đi ra 
khỏi u, trường hợp lí không có cung đi ra, head[u] được gán bằng 0. 

• link[i ] là chỉ số cung kế tiếp cung e[i] trong cùng danh sách liên thuộc các 
cung đi ra khỏi một đỉnh. Trường hợp e[i] là cung cuối cùng của một danh 
sách liên thuộc, link[i ] được gán bằng 0 

Việc duyệt các cung đi ra khỏi đỉnh u sẽ được thực hiện theo cách sau: 

i : = he ad [ u ] ; /ã là chỉ số cung đầu tiên trong danh sách liên thuộc các cung ra khỏi u 
Víhile i Ỷ 0 do //Chừng nào chira duyệt qua cung cuối danh sách liên thuộc 

begln 

«xử lý cung e[i]»; 

i : = link [i ] ; //Nhảy sang xét cung kế tiếp trong danh sách liên thuộc 

end; 

Tại mỗi bước, ta dùng thuật toán BFS đế tìm đường đi từ s tới t trên Gf, mồi 
đỉnh V trên đường đi được lưu vết trace [v] là chỉ số cung đi vào V trên đường đi 
p tìm được. Dựa vào vết này, ta sẽ liệt kê được tất cả các cung trên đường đi, 
tăng luồng trên các cung này lên A p đồng thời giảm luồng trên các cung đối đi 
Ap. 

Edmonds và Karp [12] đã đề xuất mô hình cài đặt thuật toán Ford-Fulkerson 
trong đó thuật toán BFS được sử dụng đế tìm đường tăng luồng nên người ta còn 
gọi thuật toán Ford-Fulkerson với kỳ thuật sử dụng BFS tìm đường tăng luồng là 
thuật toán Edmonds-Karp. 


H 

EDMONDSKARP.PAS V Thuật toán Edmonds-Karp 


{$MODE OBJFPC} 
program MaximumFlow; 

const 

maxN = 1000; 

maxM = 100000; 

maxC = 10000; 

type 

TEdge = record //cấu trúc một cung 

X, y: Integer; //Hai đỉnh đầu mút 
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c, f: Integer; //Sức chứa và luồng 
end; 

TQueue = record //Hàng đợi dùng cho BFS 

items: array[1..maxN] of Integer; 
front, rear: Integer; 

end; 

var 

e: array [-maxM. .maxM] of TEdge; //Danh sách các cung 

link: array[-maxM..maxM] of Integer; 

//Móc nối trong danh sách liên thuộc 

head: array[1..maxN] of Integer; 

//head[u]: Chỉ số cung đầu tiên trong danh sách liên thuộc các cung ra khỏi u 

trace: array [ 1. .maxN] of Integer; //vếtđườngđi 
n, m, s, t: Integer; 

FlowValue: Integer; 

Queue: TQueue; 
procedure Enter; //Nhập dữ liệu 
var i, u, V, capacity: Integer; 
begin 

ReadLn(n, m, s, t); 

FillChar(head[1], n * SizeOf(head[1]), 0); 

f or i := 1 to m do 
begin 

ReadLn(u, V, capacity); 

wi th e [ i ] do //Thêm cung e[i] = (u, v) vào danh sách liên thuộc của u 
begin 

X : = u ; 

y := v; 

c := capacity; 
link[i] := head[u]; 
head[u] := i; 

end; 

with e [ -i ] do //Thêm cung e[-i] = (v, u) vào danh sách liên thuộc cùa V 
begin 

X : = V ; 

y : = u ; 
c : = 0 ; 

link[-i] := head[v]; 
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head[v] := -i; 

end; 

end; 

end; 

procedure InitZeroFlow; //Khởi tạo luồng 0 

var i: Integer; 

begin 

for i := -m to m do e [i] . f := 0; 

FlowValue := 0; 

end; 

f unction FindPath: Boolean; //Tìm đường tăng luồng bằng BFS 

var u, V, i: Integer; 

begin 

FillChar(trace[ 1 ], n * SizeOf(trace [ 1 ]), 0); 

trace [s ] : = 1; //trace[sj í 0: đỉnh đã thăm, có thế ilùng hất cứ hằng số nào khác 0 

with Queue do 
begin 

items[1] := s; 

front := 1; 

rear := 1; //Hàng đợi chỉ gồm đỉnh s 

repeat 

u := items[front]; 

I nc ( f ront ) ; //Lấy một đỉnh u khỏi hàng đợi 
i := head[u]; 

while i <> 0 do //Duyệt danh sách liên thuộc của u 
begin 

V : = e [ i ] . ỵ; //nút e[i] chứe một cung đi từ u tới V 
if (trace[v] = 0) 

and (e[i].f < e[i].c) then 

//v chưa thăm và e[i] là cung thặng dư 

begin 

trace [v] := i; //Lưu vết 

if V = t then Exit(True); 

//Tìm thấy đường tăng luồng, thoát 

Inc(rear); 

items [rear] := v; //Đẩy V vào hàng đợi 

end; 

i : = link [ì] ; //Nhảy sang nút kế tiếp trong danh sách liên thuộc 
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end; 

until front > rear; 

Result := False; //Không tìm thấy đường tăng luồng 

end; 

end; 

procedure AugmentFlow; //Tăng luồng dọc đường một tăng luồng 

var Delta, V, i: Integer; 

begin 

//Trước hết xác định Delta bằng sức chứa nhở nhất của các cung trên đường tăng luồng 

V : = t; //Bắt đầu từ t 

Delta := maxC; 

repeat 

i := trace[v]; 

// e[i] là một cung trên đường tăng tuồng với sức chứe e[i].c - e[i].f 
if e[i].c - e[i].f < Delta then 
Delta := e[i].c - e[i].f; 

V : = e [ i ] . X; //Đi dần về s 

until V = s; 

//Tăng luồng thêm Delta 

V : = t; //Bắt đầu từ t 

repeat 

i := trace [v] ; //e[i] là một cung trên đường tăng luồng 
Inc(e[i].f, Delta); //Tăng luồng trên e[i] lên Delta 
Dec(e[-i] . f, Delta); //Giảm luồng trên cung đối tương ứng đi Delta 

V : = e [ i ] . X; //Đi dần về s 

until V = s; 

Inc (FlowValue, Delta); //Giá trị luồng/được tăng lên Delta 
end; 

procedure PrintResult; //In kết quả 
var i: Integer; 

begin 

WriteLn('Maximum flow: '); 

for i := 1 to m do 
with e[i] do 

if f > 0 then //Chỉ cần in ra các cung có luồng > 0 

WriteLn ( 'e [ ', i, '] = (', X, ỵ, '); c 

= ' n . ' f = ' f \ ; 

WriteLn('Value of flow; FlowValue); 

end; 
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begin 

Enter; //Nhập dữ liệu 

InitZeroFlow; //Khởi tạo luồng 0 

whỉle FindPath do //Thuật toán Ford-Fulkerson 

AugmentFlow; 

PrintResult; //In kết quả 

end. 

d) Tính đúng của thuật toán 

Trước hết dễ thấy rằng thuật toán Ford-Fulkerson trả về một luồng, tức là kết 
quả mà thuật toán trả về thỏa mãn các tính chất của luồng. Việc chứng minh 
luồng đó là cực đại đã xây dựng một định lý quan trọng về mối quan hệ giữa 
luồng cực đại và lát cắt hẹp nhất. 

Ta gọi một lát cắt ( X, Y) là một cách phân hoạch tập đỉnh V làm hai tập rời nhau: 
VnF = 0vàVUF = F. Lát cắt có s G X và t G Y được gọi là một lát cắt 5 — 
t. 

Lưu lượng từ X sang Y ( c(x, Y)) và luồng từ X sang Y (f(x, F)) được gọi là lưu 
lượng và luồng thông qua lát cắt. 

BỔ đề 3-9 

Với / là một luồng trên mạng G — (V, E, c, s, t). Khi đó luồng thông qua một lát 
cắt s — t bất kỳ bằng |/|. 

Chứng minh 

Với V — X u Y là một lát cắt 5 — ủ bất kỳ, theo Định lý 3-3 

f(X, Y) = f(X,V) - f(X,V - Y) = f{X,V) - f{X,X) = f(X,V) 

Cũng theo định lý này ta có: 

fự, V) = f(s, V) + fự-{s},V) = f(s, V)=\f\ 

0 

BỐ đề 3-10 

Với / là một luồng trên mạng G — (V, E, c, s, t). Khi đó luồng thông qua một lát 
cắt s — t bất kỳ không vượt quá lưu lượng của lát cắt đó. 

Chứng minh 

Với V = X u Y là một lát cắt s — t bất kỳ ta có 
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< 2^ c(e) = c(X, Y ) 

ee{X->Y } eE{X^K} 

Định lý 3-11 (mối quan hệ giữa luồng cực đại, đường tăng luồng và lát cắt 
hẹp nhất) 

Nếu / là một luồng trên mạng G — (y, E, c, s, t), khi đó ba mệnh đề sau là tuơng 
đương: 

a) / là luồng cực đại trên mạng G. 

b) Mạng thặng dư Gf không có đường tăng luồng. 

c) Tồn tại V — X u Y là một lát cắt s — t để f(x, Y) — c(x, Y) 

Chứng minh 

“a=>b” 

Giả sử phản chứng rằng mạng thặng dư Gf có đường tăng luồng p thì / + /p cũng 
là một luồng trên G với giá trị luồng lớn hơn /, trái giả thiết / là luồng cực đại 
trên mạng. 

“b=>c” 

Nếu Gf không tồn tại đường tăng luồng thì ta đặt X là tập các đinh đến được từ s 
bằng một đường thặng dư và Y là tập các đinh còn lại: 

X = {v. 3 đường thặng dư s V }; Y = V — X 

Rõ ràng XnY = 0,X\JY — VvầsEX, t E Y (t không thể đến được từ s bởi 
một đường thặng dư bởi nếu không thì đường đi đó sẽ là một đường tăng luồng). 

Các cung e £ {X -> Y} chắc chắn phải là cung bão hòa, bởi nếu có cung thặng dư 
e — (li, v) e {X -» Y} thì từ s sẽ tới được V bằng một đường thặng dư. Tức là 
V E X, trái với cách xây dựng lát cắt. Từ /(e) = c(e) với Ve G {X -> Y}, ta có 

= ^ c(e) = c(X,Y) 

ee{X->Y} eẼ{X->Y} 

“c=>a” 

BỐ đề 16.9 và Định lí 16.17 cho thấy giá trị của một luồng trên mạng không thế 
vượt quá lưu lượng của một lát cắt s — t bất kỳ. Nếu tồn tại một lát cắt s — t mà 
luồng thông qua lát cắt đúng bằng lưu lượng thì luồng đó chắc chắn phải là luồng 
cực đại. 

Lát cắt s — t có lưu lượng nhỏ nhất (bằng giá trị luồng cực đại trên mạng) gọi là 
Lát cắt hẹp nhất của mạng G. 


nx,Y)= y /(e) 


nx,Y)= y /(e) 
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e) Tính dừng của thuật toán 

Thuật toán Ford-Fulkerson có thời gian thực hiện phụ thuộc vào thuật toán tìm 
đuờng tăng luồng tại mồi buớc. Có thể chỉ ra đuợc ví dụ mà nếu dùng DFS đế 
tìm đuờng tăng luồng thì thời gian thực hiện giải thuật không bị chặn bởi một 
hàm đa thức của số đỉnh và số cạnh. Thêm nữa, nếu sức chứa của các cung là số 
thực, nguời ta còn chỉ ra đuợc ví dụ mà với thuật toán tìm đuờng tăng luồng 
không tốt, giá trị luồng sau mỗi buớc vẫn tăng nhung không bao giờ đạt luồng 
cực đại. Tức là nếu có thể cài đặt chuông trình tính toán số thực với độ chính 
xác tuyệt đối, thuật toán sẽ chạy mãi không dừng. 



Hình 2.8. Mạng với 4 đỉnh (1 phát, 4 thu), thuật toán Forcl-Fulkerson có thế mất 2 tỉ lần tìm đường 
tăng luồng nếu luân phiên chọn hai đường (1,2,3,4) và (1, 3,2,4) làm đường tăng luồng, mỗi lần tăng 

giá trị luồng lên 1 đơn vị. 

Chính vì vậy nên trong một số tài liệu nguời ta gọi là “phuong pháp Ford- 
Fulkerson” đế chỉ một cách tiếp cận chung, còn từ “thuật toán” đuợc dùng để chỉ 
một cách cài đặt phuong pháp Ford-Fulkerson trên một cấu trúc dữ liệu cụ thể, 
với một thuật toán tìm đuờng tăng luồng cụ thể. Ví dụ phuong pháp Ford- 
Fulkerson cài đặt với thuật toán tìm đuờng tăng luồng bằng BFS nhu trên đuợc 
gọi là thuật toán Edmonds-Karp. Tính dừng của thuật toán Edmonds-Karp sẽ 
đuợc chỉ ra khi chúng ta đánh giá thời gian thực hiện giải thuật. 

Xét Gf là mạng thặng du của một mạng G ứng với luồng / nào đó, ta gán trọng 
số 1 cho các cung thặng du của Gf và gán trọng số +00 cho các cung bão hòa 
của Gf. Dễ thấy rằng thuật toán tìm đuờng tăng luồng bằng BFS sẽ trả về một 
đuờng đi ngắn nhất từ s tới t tuong ứng với hàm trọng số đã cho. Ký hiệu 
ỗf(u,v) là độ dài đuờng đi ngắn nhất từ u tới V (khoảng cách từ lí tới V ) trên 
mạng thặng du. 
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Bổ đề 3-12 

Neu ta khởi tạo luồng 0 và thực hiện thuật toán Edmonds-Karp trên mạng 
G — ( V,E ) có đỉnh phát s và đỉnh thu t. Khi đó với mọi đỉnh V G V, khoảng 
cách từ s tới V trên mạng thặng du không giảm sau mỗi buớc tăng luồng. 


Chứng minh 

Khi V — s, rõ ràng khoảng cách từ s tới chính nó luôn bằng 0 từ khi bắt đầu tới 
khi kết thúc thuật toán. Ta chí cần chứng minh bố đề đúng với những đinh 17 =£ s. 

Giả sử phản chứng rằng tồn tại một đình 17 £ V — {s} mà khi thuật toán Edmonds- 
Karp tăng luồng / lên thành /' sẽ làm cho 8fi(s,v) nhỏ hơn ổy(s, 17). Nếu có 
nhiều đinh 17 như vậy ta chọn đình 17 có 8f! (s, v) nhỏ nhất. Gọi P = s~»u->i7là 
đường đi ngắn nhất từ s tới V trên G Ị-' . ta có (li, v) là cung thặng dư trên G Ị-' và 

8f’ (s, li) = 8f' ( s , 17 ) — 1 

Bởi cách chọn đỉnh 17, độ dài đường đi ngắn nhất từ s tới lí không thế bị giảm đi 
sau phép tăng luồng, tức là 

8fi(s,u) > 8f(s,u ) 

Ta chứng minh rằng (li, v) phải là cung bão hòa trên Gf. Thật vậy, nếu (lí, v) là 
cung thặng dư (có trọng số 1) trên Gf thì: 

8f(s, V ) < óy(s,u) + 1 (bất đẳng thức tam giác) 

< 8f’ (s, lí) + 1 (khoảng cách từ s tới u không giảm) 

= 8f’ (s, V ) 

Trái với giả thiết rằng khoảng cách từ s tới 17 phải giảm đi sau phép tăng luồng. 
Làm thế nào đế (lí, 17) là cung bão hòa trên Gf nhưng lại là cung thặng dư trên 
Gf'l Câu trả lời duy nhất là do phép tăng luồng từ / lên /' làm giảm luồng trên 
cung (lí, 17), tức là cung đối (17, ù) phải là một cung trên đường tăng luồng tìm 
được. Vì đường tăng luồng tại mỗi bước luôn là đường đi ngắn nhất nên (17, u) 
phải là cung cuối cùng trên đường đi ngắn nhất từ s tới u của Gị . Từ đó suy ra: 

óy(s, 17) = 5f(s, lí) — 1 

< 8ị-'(s,u) — 1 (khoảng cách từ s tới u không giảm) 

= 8f’ (s, 17) — 2 (theo cách chọn lí và 17) 

Mâu thuẫn với già thuyết khoảng cách từ s tới 17 phải giảm đi sau khi tăng luồng. 
Ta có điều phải chứng minh: Với Vi7 £ V, khoảng cách từ s tới 17 trên mạng thặng 
dư không giảm sau mỗi bước tăng luồng. 
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Bổ đề 3-13 

Neu thuật toán Edmonds-Karp thực hiện trên mạng G — (V, E, c, s, t ) với luồng 
khởi tạo là luồng 0 thì số luợt tăng luồng đuợc sử dụng trong thuật toán là 

O(imi). 

Chứng minh 

Ta chia quá trình thực hiện thuật toán Edmonds-Karp thành các pha. Mỗi pha tìm 
một đường tăng luồng p và tăng luồng thêm một giá trị thặng dư Ap. Giá trị thặng 
dư này theo định nghĩa sẽ phải bằng sức chứa của một cung thặng dư e nào đó 
trên đường p: 

3e E P:Ap — c(e) — /(e) 

Khi tăng luồng dọc trên được p thì cung e sẽ trở thành bão hòa. Những cung 
thặng dư trờ nên bão hòa sau khi tăng luồng gọi là cung tới hạn ( critical edge) tại 
mỗi pha. Mỗi pha có ít nhất một cung tới hạn. 

Ta đánh giá xem mỗi cung của mạng có thế trở thành cung tới hạn bao nhiêu lần. 
Với một cung e = (ụ, v), ta xét pha A đầu tiên làm e trở thành cung tới hạn và f A 
là luồng khi bắt đầu pha A. Do e nằm trên đường tăng luồng ngắn nhất trên Gf A 
nên khi pha này bắt đầu: 

Sf A (s,u ) + 1 = ôf A {s,v ) 

Pha A sau khi tăng luồng sẽ làm cung e sẽ trờ nên bão hòa. 

Đe e có thế trờ thành cung tới hạn một lần nữa thì tiếp theo pha A phải có một pha 
B giảm luồng trên cung e để biến e thành cung thặng dư, tức là cung - e — (v,u) 
phải là một cung trên đường tăng luồng của pha B. Gọi f B là luồng khi pha B bẳt 
đầu, cũng vì tính chất của đường đi ngắn nhất, ta có 

Sf B (s, v) + 1 = u) 

Bo đề 16.12 đã chứng minh rằng khoảng cách từ s tới V trên mạng thặng dư không 
giảm đi sau mỗi pha, nênổ^ B (s, v) > Sf A (s,v). Suy ra: 

Sf B (s,u ) = S fB (s,v) + 1 
> S f Ặs, v) + 1 
= S fA (s,u) + 2 

Như vậy nếu một cung (li, V ) là cung tới hạn trong k pha thì khi pha thứ k bắt 
đầu, khoảng cách từ s tới u trên mạng thặng dư đã tăng lên ít nhất 2 Ợc — 1) đơn vị 
so với thời điếm trước pha thứ nhất. Khoảng cách Sj- (s, ù) ban đầu là số không âm 
và chừng nào còn đường thặng dư đi từ s tới u, khoảng cách 8f(s,ù) không thê 
vượt quá |1/| — 1. Điều đó cho thấy k < ^ +1 = 0(|1/|). 
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Tổng hợp lại, ta có: 

• Mạng có tất cả |iT I cung. 

• Mỗi pha có ít nhất một cung tới hạn 

• Một cung có thê trở thành tới hạn trong 0(1 v\) pha 

Vậy tông số pha được thực hiện trong thuật toán Edmonds-Karp là một đại lượng 

o'm\E\) 

Định lý 3-14 

Có thế cài đặt thuật toán Edmonds-Karp đế tìm luồng cực đại trên mạng 
G — (y,E, c,s, t) trong thời gian 0(|F| |iT| 2 ). 

Chứng minh 

BÔ đê 3-15 đã chứng minh rằng thuật toán Edmonds-Karp cần thực hiện 
Odl/llEl) lượt tăng luồng. Tại mỗi lượt thuật toán tìm đường tăng luồng bằng 
BFS và tăng luồng dọc đường này có thời gian thực hiện 0(|iTI). Suy ra thời gian 
thực hiện giải thuật Edmonds-Karp là 0(|l/| lEl 2 ). 

Neu khả năng thông qua trên các cung của mạng là số nguyên thì còn có một 
cách đánh giá khác dựa trên giá trị luồng cực đại, nếu ta khởi tạo luồng 0 thì sau 
mỗi luợt tăng luồng, giá trị luồng đuợc tăng lên ít nhất 1 đon vị. Suy ra thời gian 
thực hiện giải thuật khi đó là 0(1/1 lEl) với l/l là giá trị luồng cực đại. 

3.3. Thuật toán đẩy tiền luồng 

Thuật toán Ford-Fulkerson không những là một cách tiếp cận thông minh mà 
việc chứng minh tính đúng đắn của nó cho ta nhiều kết quả thú vị về mối liên hệ 
giữa luồng cực đại và lát cắt hẹp nhất. Tuy vậy với những đồ thị kích thuớc rất 
lớn thì tốc độ của chuông trình tuong đối chậm. 

Trong phần này ta sẽ trình bày một lớp các thuật toán nhanh nhất cho tới nay đế 
giải bài toán luồng cực đại, tên chung của các thuật toán này là thuật toán đẩy 
tiền luồng (preflow-push). 

Hãy hình dung mạng nhu một hệ thống đuờng ống dần nuớc từ với điểm phát s 
tới điếm thu t, các cung là các đuờng ống, sức chứa là luu luợng đuờng ống có 
thể tải. Nuớc chảy theo nguyên tắc từ chỗ cao về chồ thấp. Với một luợng nuớc 
lớn phát ra từ s tới một đỉnh V, nếu có cách chuyển luợng nuớc đó sang địa điểm 
khác thì không có vấn đề gì, nếu không thì có hiện tuợng “tràn” xảy ra tại V, ta 
“dâng cao” điểm V để luợng nuớc đó đổ sang điểm khác (có thể đổ nguợc về s). 
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Cứ tiếp tục quá trình như vậy cho tới khi không còn hiện tượng tràn ở bất cứ 
điểm nào. Cách tiếp cận này hoàn toàn khác với thuật toán Ford-Fulkerson: thuật 
toán Ford-Fulkerson cố gắng tìm một dòng chảy phụ từ s tới t và thêm dòng 
chảy này vào luồng hiện có đến khi không còn dòng chảy phụ nữa. 


a) Tiền luồng 

Cho một mạng G — ( V, E, c, s, t). Một tiền luồng (preflow) trên G là một hàm: 


f:E —> R 
e 1 -» /(e) 

gán cho mồi cung e G E một số thực /(e) thỏa mãn ba ràng buộc: 

• Ràng buộc về sức chứa (capacity constraint): tiền luồng trên mỗi cung 
không được vượt quá sức chứa của cung đó: Ve G E: /(e) < c(e). 

• Ràng buộc về tính đối xứng lệch (skew symmetry): Với Ve G E, tiền luồng 
trên cung e và cung đối - e có cùng giá trị tuyệt đối nhưng trái dấu nhau: 
/ 0 ) = 

• Ràng buộc về tính dư: Với mọi đỉnh không phải đỉnh phát, tổng tiền luồng 
trên các cung đi vào đỉnh đó là số không âm: Vv E V — {s}: f(y,{vỴ) — 
5jee{V-»{v}}/(^0 — 0. 

Với Vv G V, ta gọi lượng tràn tại V, ký hiệu excess[v], là tổng tiền luồng trên 

các cung đi vào đỉnh v: 


excess[v] — f(y,{v }) = 


z / (e) 

eeịv^lv}} 


Đỉnh V G V — {s, t} gọi là đỉnh tràn (overflowing vertex) nếu excessịv] > 0 . 
Khái niệm đỉnh tràn chỉ có nghĩa với các đỉnh không phải đỉnh phát cũng không 
phải đỉnh thu. 

function Overflow(vGV): Boolean; 
begin 

Result := (v Ỷ s) and (v Ỷ t) and (excess[u] > 0); 

end; 
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Định nghĩa về tiền luồng tương tự như định nghĩa luồng, chỉ khác nhau ở ràng 
buộc thứ ba. Vì vậy chúng ta cũng có khái niệm mạng thặng dư, cung thặng dư, 
đường thặng dư... ứng với tiền luồng tương tự như đối với luồng. 

b) Khởi tạo 

Cho / là một tiền luồng trên mạng G — ( V,E,c,s,t ). Ta gọi h: V -» N là một 
hàm độ cao ứng với / nếu h gán cho mồi đỉnh V G V một số tự nhiên h(v) thỏa 
mãn ba điều kiện: 

• h(s) = \v\. 

• h(t) — 0. 

• h(ù) < h(y ) + 1 với mọi cung thặng dư (u, v). 

Những ràng buộc này gọi là ràng buộc độ cao. 

Hàm độ cao h khi cài đặt sê được xác định bởi tập các giá trị {h[v]} VEV nên tùy 
theo từng trường hợp, ta có thể sử dụng ký hiệu h(v) (nếu muốn nói tới giá trị 
hàm) hoặc h[v] (nếu muốn nói tới một biến số). 

Thao tác khởi tạo Init chịu trách nhiệm khởi tạo một tiền luồng và một hàm độ 
cao tương ứng. Một cách khởi tạo là đặt tiền luồng trên mỗi cung e đi ra khỏi 5 
đúng bằng sức chứa c(e) của cung đó (dĩ nhiên sẽ phải đặt cả tiền luồng trên 
cung đối - e bằng - c(e) để thỏa mãn tính đối xứng lệch), còn tiền luồng trên 
các cung khác bằng 0. Khi đó tất cả các cung đi ra khỏi s là bão hòa. 

fc(e ), nếu e 6 E + (s) 

/( e ) — j —c(e), nếu — e E E + (s ) 

(0, trường hợp khác 

Ta khởi tạo hàm độ cao h: V N như sau: 

f\v\, nếu V — s 
h(v) — ) 0, nếu V — t 

(,1, nếu V (s, t} 

Rõ ràng mọi cung thặng dư (lí, v) không thế là cung đi ra khỏi s (lí s) nên ta 
có h(u) < 1 < h(y) + 1. Hàm độ cao trên là thích ứng với tiền luồng /. 

Việc cuối cùng là khởi tạo các giá trị excessị. ] ứng với tiền luồng /. 

procedure Init; 
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begin 



//Khởi tạo tiền luồng 



for Ve 6 E do 

f[e] := 0; 


f or Vv G V do 

excess[v] := 

0; 

for Ve =(s,v) 

G E + (s ) do 


begin 



f[e] : = c 

(e) ; 


f[-e] := 

-c (e); 


excess[v] 

:= excess[v] 

+ c(e) ; 

end; 



//Khởi tạo hàm độ cao 



f or Vv G V do 

h[v] := 1; 


h[s] := 1VI 



h[t] := 0; 



end; 




c) Phép đẩy luồng 

Phép đấy luồng Push(e ) có thể thực hiện trên cung e — (lí, v) nếu các điều kiện 
sau đuợc thỏa mãn: 

• lí là đỉnh tràn: u E V — {s,t} và excessịu] > 0 

• e là cung thặng du trên Gf \ cy(e) — c(e) — /(e) > 0 

• lí cao hơn v: h(u) > h(v) 

Ràng buộc h(u) > h(y) kết hợp với ràng buộc độ cao: h(ù) < h(y) + 1 có thế 
viết thành h(u ) = h(y) + 1. 

Phép Push(e = (lí, v)) sẽ tính luợng luồng tối đa có thế thêm vào theo cung e: 
A = min[excess[it], cy(e)], thêm luợng luồng này vào cung e và bớt một luợng 

luồng A từ V về lí theo cung - e đế giữ tính đối xứng lệch của tiền luồng. Việc 
cuối cùng là cập nhật lại excess[it] và excessịv\ theo tiền luồng mới. Bản chất 
của phép Push(e — (u,v)) là chuyển một luợng luồng tràn A từ đỉnh u sang 
đỉnh V. Dễ thấy rằng các tính chất của tiền luồng vẫn đuợc duy trì sau phép 
Push: 

procedure Push(e = (u,v)); 

begin 

A := min (excess [u] , Cf (u, v) ) ; //Tính lượng luồng tối đa cỏ thể đẩy 
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f[e] := f [e ] 

+ A; f[-e; 

: = f [ - e ] — A; //Đẩy luồng 

excess[u] := 

excess[u] 

- A; 

excess[v] := 

excess[v] 

+ A ; //Cập nhật mức tràn 

end; 




Phép Push bảo tồn tính chất của hàm độ cao. Thật vậy, khi thao tác Pushị^e — 
(lí, u)) được thực hiện, nó chỉ có thể sinh ra thêm một cung thặng dư — e — 
(v,u) mà thôi. Phép Push không làm thay đối các độ cao, tức là trước khi Push, 
h[u ] > h[v] thì sau khi Push, h[v] vẫn nhỏ hon h[u], tức là ràng buộc độ cao 
h[v] < h[u] + 1 vần được duy trì trên cung thặng dư — e — ( V , ù). 

Phép Push(e — (lí, u)) đẩy một lượng luồng A = min(excess[ií], cy(e)} tràn từ 
u sang V. Neu A đúng bằng cy(e) = c(e) — /(e) có nghĩa là khi phép Push tăng 
/(e) lên A thì cung e sẽ bão hòa và không còn là cung thặng dư trên Gf nữa, ta 
gọi phép đẩy luồng này là đẩy bão hòa (saturating push), ngược lại phép đẩy 
luồng đó gọi là đấy không bão hòa (non-saturating push), sau phép đấy không 
bão hòa thì excessịu ] = 0, tức là lí không còn là đỉnh tràn nữa. 

d) Phép nâng 

Phép nâng Lift(u ) thực hiện trên đỉnh lí nếu các điều kiện sau được thỏa mãn: 

• lí là đỉnh tràn: (lí s), (lí t) và excessịu] > 0. 

• lí không chuyến được luồng xuống noi nào thấp hon: Với mọi cung thặng 
dư e — (u,v) E Ef\ h(u ) < h(v). 

Khi đó phép Lift(u ) nâng đỉnh lí lên bằng cách đặt h[u] bằng độ cao thấp nhất 
của một đỉnh V nó có thể chuyển tải sang cộng thêm 1: 


h[u] min{h[v]: 3(lí, v) 6 Ef) + 1 


procedure 

Lif t 

(UGV); 

begin 



minH := 

+ o=; 


for Vv: 

(u, v) 

£ Ef do 

if h[ 

v] < minH then minH := h[v]; 

h[u] : = 

minH 

+ 1; 

end; 
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Neu lí là đỉnh tràn thì ít nhất phải có một cung thặng dư đi ra khỏi lí, điều này 
đảm bảo cho phép lấy min{h|V|: (lí, v) E £y} được thực hiện trên một tập khác 
rồng. Thật vậy, do lí là đỉnh tràn, ta có excess[u] — H ee {i/^{ u }]/(e) > 0 tức là ít 

nhất có một cung e E [v -» (ií}| đế /(e) > 0. Cung đối - e chắc chắn là một 
cung thặng dư đi ra khỏi lí bởi: 

C/(-e) = c(—è) — /(—e) = c(-e) +/(e) > 0 

Phép Li/t không động chạm gì đến tiền luồng /. Ngoài ra phép Lift chỉ tăng 
độ cao của một đỉnh và bảo tồn ràng buộc độ cao: Với một cung thặng dư 
(v,ú) đi vào lí, ràng buộc độ cao h(v) < h( lí) + 1 không bị vi phạm nếu ta 
nâng độ cao /i(ii) của đỉnh lí. Mặt khác, với một cung thặng dư (lí, v) đi ra khỏi 
u thì việc đặt h[u] ■— min{/i[v]: 3(ií, v) E Eỹ] + 1 cũng đảm bảo rằng h(u) < 
h(y) + 1. 

e) Mô hình chung và thuật toán FIFO Preflow-Push 
□ Mô hình chung 

Thuật toán đấy tiền luồng có mô hình cài đặt chung khá đon giản: Khởi tạo tiền 
luồng / và hàm độ cao, sau đó nếu thấy phép nâng ( Lift ) hay đẩy luồng ( Push ) 
nào thực hiện được thì thực hiện nga... Cho tới khi không còn phép nâng hay 
đẩy nào có thể thực hiện được nữa thì tiền luồng / sẽ trở thành luồng cực đại 
trên mạng. 

Chính vì thứ tự các phép Push và Lift được thực hiện không ảnh hưởng tới tính 
đúng đắng của thuật toán nên người ta đã đề xuất rất nhiều co chế chọn thứ tự 
thực hiện nhằm giảm thời gian thực hiện giải thuật. 

Bổ đề 3-15 

Cho mạng G — (V, E, c, s, t) có tiền luồng / và hàm độ cao h. Với một đỉnh tràn 
u, luôn có thế thực hiện được thao tác Push(e) trên một cung e đi ra khỏi lí 
hoặc thực hiện được thao tác Lift(u ) 

Chứng minh 

Nếu thao tác Push không thế áp dụng được cho cung thặng dư nào đi ra khỏi u 
tức là với mọi cung thặng dư (u, V ) £ Ef, h(ù) không cao hơn h(v), điều đó chính 
là điều kiện họp lệ đe thực hiện thao tác Lift(ù). 
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□ Thuật toán FIFO Preflow-Push 

Định lý 3-17 là CO' sở cho thuật toán FIFO Preflow-Push. Thuật toán đuợc 
Goldberg đề xuất [18] dựa trên co chế xử lý đỉnh tràn lấy ra từ một hàng đợi. 

Tại thao tác khởi tạo, các đỉnh tràn sê đuợc lưu trữ trong một hàng đợi Queue 
hồ trợ hai thao tác: PushT oQueue(y ) để đẩy một đỉnh tràn V vào hàng đợi và 
PopFromQueue đế lấy một đỉnh tràn khỏi hàng đợi. Thuật toán sẽ xử lý từng 
đỉnh tràn z lấy ra khỏi hàng đợi theo cách sau: Trước hết cố gắng đấy luồng trên 
các cung thặng dư đi ra khỏi z bằng phép Push. Neu đẩy được hết lượng tràn 
( excess[z ] = 0) thì xong, nếu không ta dâng cao đỉnh z bằng phép Lift(z ) và 
đẩy lại z vào hàng đợi chờ xử lý sau. Thuật toán sẽ tiếp tục với đỉnh tràn tiếp 
theo trong hàng đợi và kết thúc khi hàng đợi rồng, bởi khi mạng không còn đỉnh 
tràn thì không còn thao tác Push hay Lift nào có thế thực hiện được nữa. 

Giả sử rằng chúng ta có một đỉnh tràn u và một cung e — (li, v) không thế đẩy 
luồng được, tức là ít nhất một trong hai điều kiện sau đây được thỏa mãn: 

• (lí, v) là cung bão hòa c(e) = /(e). 

• lí không cao hon v: h(u ) < h(v). 

Khi đó: 

• Sau bất kỳ phép Push nào, chúng ta vần không thể đấy luồng được trên 
cung e — (lí, v ). Thật vậy, nếu lí không cao hon V, phép Push không làm 
thay đổi hàm độ cao nên sau phép Push thì lí vẫn không cao hon V. Neu lí 
cao hon V thì e phải là cung bão hòa, lệnh Push duy nhất có thế biến nó 
thành cung thặng dư là lệnh Push(—e ) làm giảm /(e) . Nhưng lệnh 
Push(—e ) không thế thực hiện được vì cung - e — (v, ù) có V thấp hon u. 

• Sau bất kỳ phép Lift nào ngoại trừ Lift(u), chúng ta cũng không thể đấy 
luồng được trên cung e — (lí, v ). Bởi phép Lift không làm thay đối tiền 
luồng trên các cung, tính bão hòa hay thặng dư của các cung được giữ 
nguyên. Như vậy nếu (lí, v) đang bão hòa thì sau phép Lift nó vẫn bão hòa 
và không thể đẩy luồng được. Neu (lí, v) là cung thặng dư thì lí đang không 
cao hon V, lệnh Lift duy nhất có thể khiến lí cao hon V là lệnh Lift(u). 

Hai nhận định trên cho phép ta xây dựng một cấu trúc dữ liệu hiệu quả đế cài đặt 
thuật toán: 
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Tương tự như chương trình cài đặt thuật toán Edmonds-Karp, ta sử dụng mảng 
e[—m...m] chứa các cung, mảng link[m ...m] chứa móc nối trong danh sách 
liên thuộc và mảng head[l ...n] chứa chỉ số cung đầu tiên của các danh sách 
liên thuộc. Ngoài ra thuật toán duy trì một mảng chỉ số citrrent[l ...n], ở đây 
currentịv] là chỉ số của một cung nào đó trong danh sách liên thuộc các cung 
đi ra khỏi V, ban đầu currentịv] được gán bằng head[v ] với mọi đỉnh V G V. 
type 

TEdge = record //cấu trúc một cung 
X, ỵ: Integer; //Hai đỉnh đầu mút 
c, f: Integer; //Sức chứa và luồng 

end; 

var 

e: array [-maxM. .maxM] of TEdge; //Danh sách các cung 

link: array [-maxM..maxM] of Integer; 

//Móc nối trong danh sách liên thuộc 

head, current: array[ 1..maxN] of Integer; 

Trên cấu trúc dữ liệu này, danh sách móc nối các nút chứa các cung đi ra khỏi z 
là: 

e[iil e[i 2 ị e[i 3 ị... 

Trong đó i Ấ — head[z ], i 2 — linkịi^], i 3 — link[i 2 ],... 

Thuật toán FIFO Preflow-Push sẽ xử lý lần lượt từng đỉnh tràn lấy ra khỏi hàng 
đợi. Với mồi đỉnh tràn z lấy khỏi hàng đợi, cung e[citrrent[z]] là một cung đi 
ra khỏi z, giả sử cung đó là (z, v). Nếu phép đấy luồng ( Push ) trên cung đó có 
thế thực hiện được thì thực hiện ngay, đồng thời đẩy V vào hàng đợi nếu V chưa 
có trong hàng đợi. Neu phép đẩy luồng này làm z hết tràn thì chuyển sang xử lý 
đỉnh tràn kế tiếp trong hàng đợi, ngược lại nếu z vẫn còn là đỉnh tràn (tức là 
không thể đẩy luồng trên cung e[citrrent[z]] nữa), ta dịch chỉ số current[z] 
sang cung kế tiếp trong danh sách liên thuộc ( current[z] := link[current[z ]\) 
đế chuyển sang xét một cung khác...Khi dịch chỉ số current[z ] đến hết danh 
sách liên thuộc mà z vẫn tràn, đỉnh z sẽ được nâng lên bằng phép Lift(z ), chỉ số 
citrrent[x] được đặt trở lại bằng head[z ] đế nó trỏ lại về đầu danh sách liên 
thuộc. Đỉnh z sau đó được đấy lại vào hàng đợi chờ xử lý sau... 
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Tính hợp lý của thuật toán nằm ở chồ : khi đỉnh tràn z bắt đầu đuợc xử lý, tất cả 
những cung đứng trước cung e[citrrent[z]] đều không thể đẩy luồng được. Tức 
là nếu muốn đẩy luồng ra khỏi z thì chỉ cần xét các cung từ eịcurrent[z]\ trở đi 
là đủ, không cần duyệt từ đầu danh sách liên thuộc. 

procedure FIFOPreflowPush; 

begin 

I ni t; //Khởi tạo tiền luồng, độ cao, hàng đợi Queue chứa các đỉnh tràn 

while Queue Ỷ 0 do 
begin 

z := PopFromQueue ; //Xử lý đỉnh tràn X lẩy ra từ hàng đợi 
while current [z] <> 0 do //cố gắng đẩy luồng khỏi z 

begin //Xét cung (z, v) chứa trong nút e[current[z]] 

V := e[current[z]].ỵ; 

if «có thể đẩy luồng trên cung (z, v)» then 
begin 

NeedQueue := (v Ỷ s) and (v + t) 

and (excess [v] = 0); 

Push(z, v) ; //Đẩyluồng 
if NeedQueue then 

//Sau phép đấy, V đang không tràn trở thành tràn 

PushToQueue (V) ; //Đẩy V vào hàng đợi chờ xử lý 
if excess[z] = 0 then Break; 

//Sau phép đây mà z hết tràn thì dừng đây 

end; 

current[z] := link [current [z]]; 

//z chua hết tràn, chuyến sang xét cung liên thuộc tiếp theo 

end; 

if excess [ z ] > 0 then //Duyệt hết danh sách liên thuộc màX vẫn tràn 

begin 

L i f t ( z ) ; //Dâng cao z 
current[z] := head[z]; 

//Đặt lại chỉ số current[z] về nút đầu danh sách liên thuộc 
PushToQueue ( z ) ; //Đẩy z vào hàng đợi'chờ xử lý sau 

end; 

end; 

end; 
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Từ nhận xét trên, có thể nhận thấy rằng những phép Push và Lift trong mô hình 
cài đặt đảm bảo được gọi tại những thời điếm mà những điều kiện cần đế thực 
thi chúng được thỏa mãn. 


f) Tính đúng của thuật toán 

Sau mỗi bước của vòng lặp chính, hàng đợi Queue luôn chứa danh sách các 
đỉnh tràn và thuật toán sẽ kết thúc khi không còn đỉnh tràn nào trên mạng. Với 
Vu G V — (s, t}, ta có: 

/({ v},V) — —f(y,{vỴ) — — excess[v] — 0 

Tức là với Vu G V — (s, t} thì tổng luồng trên các cung đi ra khỏi u bằng 0, điều 
này chỉ ra rằng khi thuật toán kết thúc, tiền luồng chúng ta duy trì trên mạng trở 
thành một luồng. 


Định lý 3-16 

Cho / là một tiền luồng trên mạng G — (V, E, c, s, t), nếu tồn tại một hàm độ cao 
h: V -» N ứng với / thì mạng thặng dư Gf không có đường tăng luồng. 

Chứng minh 

Nhắc lại về ràng buộc độ cao: h(s ) = |v|, h(t) — 0 và với mọi cung thặng dư 
(u,v) thì h(u ) < h(v) + 1. Giả sử phản chứng rằng có đường tăng luồng (s — 
v 0 , u 1; ... ,v k — t) trên mạng thặng dư Gf đi qua k cung thặng dư. Khi đó: 

h(v 0 ) < hCiy) + 1 < h(v 2 ) + 2 < ••■ < h(v k ) + k 

hay 


h(s) < h(t) + k 

'm 0 

Ta có |1/| < k, nhưng đường tăng luồng phải là đường đi đơn, tức là qua không 
quá \v\ — 1 cạnh, vậy k < \v\ — 1. Điều này mâu thuẫn, nghĩa là không thế tồn tại 
đường tăng luồng trên Gf. 

Định lý 3-17 và Định lý 3-11 (mối quan hệ giũa luồng cực đại, đường tăng 
luồng và lát cắt hẹp nhất) chỉ ra rằng: thuật toán đấy tiền luồng trả về một luồng 
và một hàm độ cao ứng với luồng đó nên luồng trả về chắc chắn là luồng cực 
đại. 
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g) Tính dừng của thuật toán 

Tính dừng của thuật toán đẩy tiền luồng ở trên sẽ đuợc suy ra khi chúng ta phân 
tích thời gian thực hiện giải thuật. Tuơng tự nhu thuật toán Ford-Fulkerson, 
chúng ta sẽ không phân tích thời gian thực hiện trên mô hình tổng quát mà chỉ 
phân tích thời gian thực hiện giải thuật FIFO Preflow-Push mà thôi. 

Định lý 3-17 

Cho / là một tiền luồng trên mạng G — (y, E, c, s, t), khi đó với mọi đỉnh tràn u, 
tồn tại một đuờng thặng du đi từ u tới s. 

Chứng minh 

Với một đinh tràn u bất kỳ, xét tập X là tập các đình có thế đến được từ u bằng 
một đường thặng dư. Đặt Y — V — X là tập những đình nằm ngoài X. Trước hết ta 
chỉ ra rằng tiền luồng trên các cung thuộc {Y -> X} không thế là số dương. Thật 
vậy nếu có e £ {Y -> X} mà /(e) > 0 thì - e £ {X -> Y} và /(—e) < 0. Suy ra có 
cung thặng dư - e nối một đình thuộc X với một đình y nào đó thuộc Y. Theo cách 
xây dựng tập X, y sẽ phải là đỉnh thuộc X. Mâu thuẫn. 

Tiền luồng trên các cung thuộc {Y -> X} không thế là số dương thì f(Y, X) < 0. 
Ta xét tông mức tràn của các đình £ X : 

excessỢỉ ) = f(y,x) = f(x,x) + f(Y,X ) < 0 

0 <0 

Lượng tràn tại mỗi đinh không phải đỉnh phát đều là số không âm, ngoài ra u là 
đình tràn £ X nên excessịu] > 0, điều này cho thấy chắc chắn đinh phát s phải 
thuộc X đế excess(X) < 0. Nói cách khác từ u đến được s bằng một đường thặng 
dư. 

Hệ quả 

Cho mạng G — (V, E, c, s, t). Giả sử chúng ta thực hiện thuật toán đấy tiền luồng 
với hàm độ cao h\ V hí thì độ cao của các đỉnh trong quá trình thực hiện giải 
thuật không vuợt quá 2\v\ — 1. 

Chứng minh 

Mạng phải có ít nhất một đình phát và một đình thu nên |F| > 2. Ban đầu, 
h(s) — \v\, h{t) = 0 và h{v') = 1, Vu Ệ. (s, t) nên độ cao của các đỉnh đều nhỏ 
hơn 21FI - 1. 

Độ cao của s và t không bao giờ bị thay đối và với mỗi đình u £ V — (s, t} thì chi 
phép Lift(u ) có thế làm tăng độ cao của đinh u. Điều kiện đế thực hiện phép 
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Lift(u ) là u phải là đình tràn. Phép Lift không thay đối tiền luồng nên sau phép 
Lift(ụ ) thì u vẫn tràn. Áp dụng kết quả của Định lý 3-17, tồn tại đường đi đơn 
từ u tới s {u — v 0 , v ± ,..., v k — s) chì đi qua k cung thặng dư 
(ư 0 , v 1 ),(v 1 ,v 2 ),...,(y k - 1 , v k y Từ ràng bưộc độ cao ta có: 

h(u) — h(v 0 ) < / 1 ( 1 ^) + 1 < h(v 2 ) + 2 < ■■• < h(v k ) + k < \v\ + k 

Đường đi đơn thì không qua nhiều hơn |v| — 1 cạnh nên ta có k < |F| — 1, kết 
hợp lại có h(ù) < 2\v\ - 1. ĐPCM. 

Định lý 3-18 (thời gian thực hiện giải thuật FIFO Preflow-Push) 

Có thể cài đặt giải thuật FIFO Preflow-Push đế tìm luồng cực đại trên mạng 
G — (y,E, c,s, t ) trong thời gian 0(|F| 3 + \V\\E\). 

Chứng minh 

Ta sẽ chứng minh mô hình cài đặt thuật toán FIFO Preflow-Push ở trên có thời 
gian thực hiện là 0(|F| 3 + iPlliTl). Vòng lặp chính của thuật toán mỗi lượt lấy 
một đinh tràn z khỏi hàng đợi và cố gắng tháo luồng cho đinh z bằng các 
phép Push theo các cung đi ra khỏi z. Nếu z chưa hết tràn thì thực hiện phép 
Li/t(z) và đấy lại z vào hàng đợi. Như vậy thuật toán FIFO Preflow-Push sẽ thực 
hiện một dãy các phép Lift và Push: 

Lift (.), Push (.), Push (.) ..., Push (.), Lift (.), Push (.),... 

Trước hết ta chứng minh rằng số phép Lift trong dãy thao tác trên là 0(|F| 2 ) và 
tống thời gian thực hiện chúng là 0(|F||F|). Thật vậy, Mỗi phép Lift sẽ nâng độ 
cao của một đỉnh lên ít nhất 1, ngoài ra độ cao của mỗi đình không vượt quá 
2|F| — 1 (theo hệ quả của định lý Định lý 3-17). Cứ cho là mọi đỉnh £ V — 
{s, t) khi kết thúc thuật toán đều có độ cao 21VI — 1 đi nữa thì do chúng được khởi 
tạo bằng 1, tống số phép Lift cần thực hiện cũng không vượt quá: 

(|F|-2)(2|F|-2) = 0(|F| 2 ) 

Mỗi cung (u, ư) sẽ được xét đến đúng một lần trong phép Lift(ù), phép Lift(u ) 
lại được gọi không quá 21VI — 2 lần. Vậy tống cộng trong tất cả các phép Lift thì 
mỗi cung sẽ được xét không quá 21VI — 2 lần, mạng có IÍT I cung suy ra tống thời 
gian thực hiện của các phép Lift trong giải thuật là |£'|(2|F| — 2) = 0(|K||£|). 

Tiếp theo ta chứng minh rằng số phép đấy bão hòa cũng như tống thời gian thực 
hiện chúng là 0(|F| |£'|). Sau phép đấy bão hòa Pushie ), nếu muốn thực hiện tiếp 
phép đấy Push(e ) nữa thì trước đó chắc chắn phải có phép đấy Push(—e) đế làm 
giảm /(e) và biến e trở lại thành cung thặng dư. Giả sử e — (u, v) và - e — (v,u) 
thì để thực hiện phép Push(è), ta phải có h(ù) > /i(v). Để thực hiện Push(—è), 
ta phải có h(ỳ) > h(ụ ) và đế thực hiện tiếp Push(e~) nữa ta lại phải có h(ù) > 
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h(v). Bởi độ cao của các đinh không bao giờ giảm đi nên sau phép Pushie ) thứ 
hai, độ cao h(ù) lớn hơn ít nhất 2 đơn vị so với h(u ) ở phép Push(e ) thứ nhất. 
Vậy nếu một cung e — (u, ư) của mạng đu'ỢC đấy bão hòa k lần thì độ cao của 
đình u sẽ tăng lên ít nhất là 2 ực — 1). Vì độ cao của các đinh không vuợt quá 
2\v\ — 1 nên số phép đấy bão hòa trên mỗi cung e là k < IVI. Mạng có I/rI cung 
và thời gian thực hiện phép Push là 0(1) nên số phép đấy bão hòa là 0(|1/| IEI) và 
thời gian thực hiện chúng cũng là 0(11/1 |iTI). 

Đối với các phép đấy không bão hòa, việc đánh giá thời gian thực hiện giải thuật 
đuợc thực hiện bằng hàm tiềm năng (potential ýunctiorì). Định nghĩa hàm tiềm 
năng 0 là độ cao lớn nhất của các đinh tràn: 

0 = ma x{h[v]:v là đỉnh tràn} 

Trong trường hợp mạng không còn đinh tràn thì ta quy ước 0 = 0. Vậy 0 < 1 khi 
khởi tạo tiền luồng và trở lại bằng 0 khi thuật toán kết thúc. 

Chia dãy các thao tác Lift và Push làm các pha liên tiếp. Pha thứ nhất bắt đầu khi 
hàng đợi được khởi tạo gồm các đình tràn và kết thúc khi tất cả các đỉnh đó (và 
chỉ những đình đó thôi) đã được lấy ra khỏi hàng đợi và xử lý. Pha thứ hai tiếp tục 
với hàng đợi gồm những đình được đấy vào trong pha thứ nhất và kết thúc khi tất 
cả các đình này được lấy ra khỏi hàng đợi và xử lý, pha thứ ba, thứ tư... được chia 
ra theo cách tương tự như vậy. 

Nhận xét rằng phép Push chi đấy luồng từ đinh cao xuống đình thấp, vậy nên 
những đình được đẩy vào hàng đợi sau phép Push luôn thấp hơn đinh đang xét 
vừa lấy ra khỏi hàng đợi. Suy ra nếu một pha chi chứa phép Push thì giá trị hàm 
tiềm năng 0 sau pha đó giảm đi ít nhất 1 đơn vị. 

Giá trị hàm tiềm năng <t> chi có thế tăng lên sau một pha nếu pha đó có chứa phép 
Lift và giá trị 0 tăng lên phải bằng một độ cao của một đinh V nào đó sau phép 
Lift(y ) trong pha. Xét mức tăng của 0 sau pha đang xét: 

^mới - ^cũ = kOOmới - ®cũ ^ h(v) mớ i - h(v)cũ 
Tức là sau mỗi pha làm <Ị> tăng lên, luôn tồn tại một đinh V mà mức tăng độ cao 
của V lớn hơn mức tăng của 0. Xét trên toàn bộ giải thuật, độ cao của mỗi đinh 
V £ V — (s, t) được khởi tạo bằng 0 và được nâng lên tối đa bằng 211/1 — 1 nên 
tông toàn bộ mức tăng của các đình không vượt quá (|l/| — 2)(2|l/| — 1) = 

0(|P| 2 ). 

Vậy nêu ta xét các pha làm <t> tăng thì tông mức tăng của <Ị> trên các pha này là 
0(|P| 2 ), tức là số các pha làm <t> giảm cũng phải là 0(|K| 2 ). Nói cách khác, sẽ chỉ 
có 0(|y| 2 ) pha có chứa phép Lift và 0(|1/| 2 ) pha không chứa phép Lift. Cộng lại 
ta có số pha cần thực hiện trong toàn bộ giải thuật là 0(11/| 2 ). 


205 


Một pha sẽ phải lấy khỏi hàng đợi tối đa |v| — 2 đinh đế xử lý. Với mỗi đinh lấy 
từ hàng đợi, việc tháo luồng sẽ chỉ sử dụng tối đa 1 phép đẩy không bão hòa vì 
sau phép đấy này thì đình sẽ hết tràn và quá trình xử lý sẽ chuyến sang đinh tiếp 
theo trong hàng đợi. Vậy trong mỗi pha có không quá \v\ — 2 phép đấy không bão 
hòa. Vì tống số pha là 0(|l/| 2 ), ta có số phép đấy không bão hòa trong cả giải 
thuật là 0(|1/| 3 ) và tông thời gian thực hiện chúng cũng là 0(11/| 3 ). 

Cuối cùng, ta đánh giá thời gian thực hiện những thao tác duyệt danh sách liên 
thuộc bằng các chỉ số current[.] trong thuật toán F1F0 Preflow-Push. Với mỗi 
đỉnh z, chỉ số current[z] ban đầu sẽ ứng với nút đầu danh sách liên thuộc và 
chuyển dần đến hết danh sách gồm deg + (z) nút. Khi duyệt hết danh sách liên 
thuộc mà z vẫn tràn thì sẽ có một phép Lt/t(z) và con trỏ current[z\ được đặt lại 
về đầu danh sách liên thuộc, số phép Lt/t(z) trong toàn bộ giải thuật không vượt 
quá 2\v\ — 1, nên số lượt dịch chỉ số current[z ] không vượt quá 21VI deg + (z). 
Suy ra nếu xét tống thể, số phép dịch các chỉ số current[.] trên tất cả các danh 
sách liên thuộc phải nhỏ hơn: 



(2|F|) > deg + (z) = 2|Fp| =0(|Fp|) 


Kết luận: 

Tông thời gian thực hiện các phép nâng: 0(|F| |iT|). 

Tông thời gian thực hiện các phép đây bão hòa: 0(|F||E|). 
Tông thời gian thực hiện các phép đây không bão hòa: 0(|1/| 3 ). 


Tống thời gian thực hiện các phép duyệt danh sách liên thuộc bằng chỉ số 
currentị.]: 0(|v||£|). 


Thời gian thực hiện giải thuật F1F0 Preflow-Push: 0(|1/| 3 + |1/| 

h) Một số kỹ thuật tăng tốc độ giải thuật 

Ta đã chứng minh rằng thuật toán Edmonds-Karp có thời gian thực hiện 
0(|F||lí| 2 ) và thuật toán FIFO Preflow-Push có thời gian thực hiện 0(1 V1 3 + 
IIV11ii I). Những đại luợng này thoạt nhìn làm chúng ta có cảm giác nhu thuật 
toán FIFO Preflow-Push thực hiện nhanh hon thuật toán Edmonds-Karp, đặc 
biệt trong truờng hợp đồ thị dày ( \E\ » |F|). 

Tuy vậy, những đánh giá này chỉ là cận trên của thời gian thực hiện giải thuật 
trong truờng hợp xấu nhất. Hiện tại chua có các đánh giá chặt về cận trên và cận 
duới trong truờng hợp trung bình. Những thử nghiệm bằng chuông trình cụ thế 
cũng cho thấy rằng các thuật toán đấy tiền luồng nhu FIFO Preflow-Push, Lift- 
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to-Front Preflow-Push, Highest-Label Preflow-Push... không có có cải thiện gì 
về tốc độ so với thuật toán Edmonds-Karp (thậm chí còn chậm hon) nếu không 
sử dụng những mẹo cài đặt (heurỉstics). 

Chua có đánh giá lý thuyết chặt chẽ nào về tác động của những mẹo cài đặt lên 
thời gian thực hiện giải thuật nhung hầu hết các thử nghiệm đều cho thấy việc sử 
dụng những mẹo cài đặt trên thực tế gần nhu là bắt buộc đối với các thuật toán 
đẩy tiền luồng. 

□ Bản chất của hàm độ cao 

Nhắc lại về ràng buộc độ cao: Xét một tiền luồng / trên mạng G — (V, E, c, s, t), 
hàm độ cao h: V -» N gọi là tuong ứng với tiền luồng / nếu h(s ) — \v\; 
h(t) — 0; và với mọi cung thặng du (lí, u) thì h(u) < h(v ) + 1. 

Neu ta gán trọng số cho các cung của mạng thặng du Gf theo quy tắc: Cung 
thặng du có trọng số 1 và cung bão hòa có trọng số + 00 . Ký hiệu ỗf(u,v) là độ 
dài đuờng đi ngắn nhất từ u tới u trên Gf với cách gán trọng số này. Khi đó 
không khó khăn kiếm chứng đuợc rằng với Vu G V — (s, t}: 

• h(u) < ỗf(v, t), tức là h(v ) luôn là cận duới của độ dài đuờng đi ngắn nhất 
từ u tới đỉnh thu. 

• Trong truờng hợp h(v) > |P|, từ u chắc chắn không có đuờng thặng du đi 

tới t và h{y ) — |F| < Sf(v, s), tức là h(u) — |F| trong truờng hợp này là 

cận dưới của độ dài đường đi ngắn nhất từ V về đỉnh phát. 

Những mẹo cài đặt dưới đây nhằm đẩy nhanh các độ cao h{v) trong tiến trình 
thực hiện giải thuật dựa vào những nhận xét trên. 

□ Gán nhãn lại toàn bộ 

Nội dung của phưong pháp gán nhẵn lại toàn bộ (global relabeling heurỉstỉc) 
được tóm tắt như sau: Xét lát cắt chia tập V làm hai tập rời nhau X và Y: Tập Y 
gồm những đỉnh đến được t bằng một đường thặng dư và tập X gồm những đỉnh 
còn lại. Chắc chắn không có cung thặng dư nối từ X sang Y, ta có s G X, t G Y . 
Phép gán nhãn lại toàn bộ sẽ đặt: 

• Với Vu G Y, ta gán lại độ cao h[v] := ỗf(v, t). 

• Với Vit G X và Sf(u,s ) < + 00 , ta gán lại độ cao h[u] •■= |p| + Sf(u,s ) 
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• Với Vit G X và ốf(u,s ) = + 00 , ta gán lại độ cao h[u] := 2\v\ — 1 

Không khó khăn đế kiếm chứng tính hợp lý của hàm độ cao mới. Có thể thấy 
rằng các độ cao mới ít ra là không thấp hon các độ cao cũ. 

Các giá trị 8f(y,t) cũng như 8f(u,s ) có thế được xác định bằng hai lượt thực 
hiện thuật toán BFS từ t và s. Bởi ta cần thời gian OdEl) cho hai lượt BFS và 
gán lại các độ cao, nên phép gán nhãn lại toàn bộ thường được gọi thực hiện sau 
một loạt chỉ thị so cấp đế không làm ảnh hưởng tới đánh giá 0 lớn của thời gian 
thực hiện giải thuật (chang hạn sau mồi |F| phép Lift). Chú ý là khi nâng độ cao 
h[z] của một đỉnh z nào đó, cần cập nhật lại current[z] ■— head[z ]. 

□ Đây nhãn theo khe 

Phép đấy nhãn theo khe ( gap heurỉstỉc ) được thực hiện nhờ quan sát sau: 

Giả sử ta có một số nguyên 0 < gap < |F| mà không đỉnh nào có độ cao gap 
(số nguyên gap này được gọi là “khe”), khi đó mọi đỉnh z có h[z] > gap đều 
không có đường thặng dư đi đến t. 

Nhận định trên có thể chứng minh bằng phản chứng: Giả sử từ z có đường thặng 
dư đi đến t, với một cung (lí, v) trên đường đi ta có h(ù) < h(y ) + 1, tức là trên 
đường đi này, từ một đỉnh u ta chỉ có thế đi sang một đỉnh V không thấp hon 
hoặc thấp hon u đúng một đon vị. Từ h(z) > gap > 0 và /i(t) = 0, chắc chắn 
trên đường thặng dư từ X tới t phải có một đỉnh độ cao gap. Mâu thuẫn với giả 
thuyết phản chứng. 

Phép đẩy nhãn theo khe nếu phát hiện khe 0 < gap < |F| sẽ xét tất cả những 
đỉnh z E V — {s} có gap < h(z ) < |F| và đặt lại h[z] ■— |F| + 1. 

Ta sẽ chỉ ra rằng phép đẩy độ cao này vẫn đảm bảo ràng buộc độ cao của hàm h. 
Độ cao của đỉnh phát và đỉnh thu không bị động chạm đến, tức là h[s] — |F| và 
h[t] — 0. Trước khi thực hiện phép đẩy theo khe, ta chia tập đỉnh V thành hai 
tập rời nhau: Tập X gồm những đỉnh cao hon gap và tập Y gồm những đỉnh thấp 
hon gap. Do ràng buộc độ cao h(u ) < h(y) + 1 với mọi cung thặng dư (u,v), 
không tồn tại cung thặng dư nối từ X tới Y. Phép đẩy theo khe chỉ tăng độ cao 
của một vài đỉnh X G X và như vậy ràng buộc độ cao nếu bị vi phạm thì chỉ bị vi 
phạm trên những cung thặng dư đi ra khỏi X. Như lập luận trên, cung thặng dư đi 
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ra khỏi X chắc chắn phải đi vào một đỉnh x' E X có độ cao ít nhất là I ì/ 1 sau phép 
đẩy theo khe. Từ h(x ) = |v| + 1 ta có /i(x) < /i(x') + 1. 

Phép đây nhãn theo khe sử dụng mảng count[ 0 ... 2\v\ — 1] đê đêm countịk ] là 
số đỉnh có độ cao k. Mồi khi có sự thay đối độ cao, ta phải đồng bộ lại mảng 
count theo tình trạng hàm độ cao mới. Sau mỗi phép Lift(u), độ cao cũ của 
đỉnh lí đuợc lưu trữ lại trong biến OldH và phép Lift thực hiện như bình 
thường. Sau đó nếu 0 < OldH < |F| và countịOldH] — 0, phép đẩy theo khe 
OldH sẽ được gọi và thực hiện trong thời gian 0(|F|). Bởi số phép Lift cần 
thực hiện trong toàn bộ giải thuật là 0(1 F| 2 ), tổng thời gian thực hiện các phép 
đẩy theo khe sẽ là 0(|F| 3 ) nên không ảnh hưởng tới đánh giá O-lớn của thời 
gian thực hiện giải thuật FIFO Preflow-Push. 

Dưới đây là bảng so sánh tốc độ của các chuông trình cài đặt cụ thể trên một số 
bộ dữ liệu. Với một cặp số n,m, 100 đồ thị với n đỉnh, m cung được sinh ngẫu 
nhiên với sức chứa là số nguyên trong khoảng từ 0 tới 10 4 . Có 4 chuông trình 
được thử nghiệm: A: Thuật toán Edmonds-Karp, B: thuật toán FIFO Preflow- 
Push, C: thuật toán FIFO Preflow-Push với phép gán nhãn lại toàn bộ và D: 
thuật toán FIFO Preflow-Push với phép đẩy nhãn theo khe. Mồi chuông trình 
được thử trên cả 100 đồ thị và đo thời gian thực hiện trung bình (tính bằng giây): 



n — 100 
m — 10000 

n — 200 
m — 30000 

n — 500 
m — 40000 

n — 800 
m — 90000 

n — 1000 
m — 100000 

A 

0.0688 

0.5925 

0.6598 

1.7158 

2.7629 

B 

0.0983 

0.7395 

3.4377 

9.9014 

25.0723 

c 

0.0313 

0.0624 

0.0857 

0.1809 

0.2433 

D 

0.0282 

0.0577 

0.0828 

0.1575 

0.1889 


□ Cài đặt 


Dưới đây là chuông trình cài đặt thuật toán FIFO Preflow-Push kết hợp với kỳ 
thuật đẩy nhãn theo khe, việc cài đặt và đánh giá hiệu suất của phép gán nhãn lại 
toàn bộ chúng ta coi như bài tập. Các bạn có thể thử cài đặt kết hợp cả hai kỳ 
thuật tăng tốc này đế xác định xem việc đó có thực sự cần thiết không. 
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Input/Output có khuôn dạng giống như ở chương trình cài đặt thuật toán 
Edmonds-Karp. Hàng đợi chứa các đỉnh tràn được tổ chức dưới dạng danh sách 
vòng: Các chỉ số đầu/cuối hàng đợi sẽ chạy xuôi trong một mảng và khi chạy 
đến hết mảng sẽ tự động quay về đầu mảng. 


H 

FIFOPREFLOWPUSH.PAS ✓ Thuật toán FIFO Preflow-Push 


{$MODE OB JFPC } 
program MaximumFlow; 

const 

maxN = 1000; 

maxM = 100000; 

maxC = 10000; 

type 

TEdge = record //cấu trúc một cung 

X, y: Integer; //Hai đỉnh đầu mút 
c, f : Integer; //Sức chứa và luồng 
end; 

TQueue = record //cấu trúc hàng đợi 

items : array [ 0 . .maxN - 1] of Integer; //Danh sách vòng 

front, rear, nltems: Integer; 

end; 

var 

e: array [ -maxM. .maxM] of TEdge; //Măng chửa các cung 

link: array [-maxM..maxM] of Integer; 

//Móc nối trong danh sách liên thuộc 

head, current: array [1..maxN] of Integer; 

//con trò tói đầu và vị trí hiện tại của danh sách liên thuộc 

excess: array [ 1. . maxN] of Integer; //mức tràn của các đĩnh 

h: array [ 1. .maxN] of Integer; //hàmđộcao 

count: array[0..2 * maxN - 1] of Integer; 

//count[k] = số đỉnh có độ cao k 

Queue : TQueue; //Hàng đợi chứa các đỉnh tràn 
n, m, s, t: Integer; 

FlowValue: Integer; 
procedure Enter; //Nhập dữ liệu 

var 

i, u, V, capacity: Integer; 

begin 
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ReadLn(n, m, s, t); 

FillChar(head[1], n * SizeOf(head[1]), 0); 

f or i := 1 to m do 
begin 

ReadLn(u, V, capacity); 

wi th e [ i ] do //Thêm cung e[i] = (u,v) vào danh sách liên thuộc của u 
begin 

X : = u ; 
ỵ := v; 

c := capacitỵ; 
link[i] := head[u]; 
head[u] := i; 

end; 

with e [ -i ] do //Thêm cung e[-i] = (v, u) vào danh sách liên thuộc cùa V 
begin 

X : = V ; 

ỵ : = u ; 
c : = 0 ; 

link[-i] := head[v]; 
head[v] := -i; 

end; 

end; 

for V := 1 to n do current[v] := head[v]; 

end; 

procedure PushToQueue (v: Integer) ; //Đẩy một đỉnh V vào hàng đợi 
begin 

with Queue do 
begin 

rear := (rear + 1) mod maxN; 

//Dịch chí số cuối hàng đợi, rear = maxN -1 sẽ trở lại thành 0 
items [rear] := v; //Đặt V vào vị trí cuối hàng đợi 
I n c ( n 11 em s) ; //Tăng biến đếm số phần tử trong hàng đợi 
end; 

end; 

íunction PopFromQueue : Integer; //Lấy một đỉnh khỏi hàng đợi 

begin 

with Queue do 
begin 
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Result := ìtems [ f ront ] ; //Trả về phần tử ở đầu hàng đợi 
front := (front + 1) mod maxN; 

//Dịch chí so đầu hàng đợi,front = maxN ■ 1 sẽ trở lại thành 0 
Dec (nltems) ; //Giảm biến đếm số phần tử trong hàng đợi 

end; 

end; 

procedure Init; //Khởi tạo 

var V, sf, i: Integer; 

begin 

//Khởi tạo tiền luồng 

for i := -m to m do e[i].f := 0; 

FillChar(excess [1], n * SizeOf (excess[1]), 0); 
i := head[s]; 

Víhile i <> 0 do 

//Duyệt các cung đi ra khỏi đỉnh phát và đấy bão hòa các cung đó, cập nhật các mức tràn excess[.] 

begin 


sf : 

= e [i] . c; 


e [i] 

. f : = s f; 


e [-Í 

],f := -sf; 


Inc ( 

excess [e [i] 

. y] , sf) ; 

Dec ( 

excess [s], 

sf) ; 

i : = 

link[ì]; 


end; 



//Khởi tạo hàm độ cao 


for V := 

1 to n do 

h[v] := 1; 

h[s] : = 

n; 


h [ t ] : = 

0; 


//Khởi tạo các biến đếm: count[k] là số đỉnh có độ cao k 

FillChar 

(count[0], 

(2 * n) * SizeOf(count[0]) , 

count [n] 

:= 1; 


count [ 0] 

:= 1; 


count [ 1] 

: = n - 2 ; 



//Khởi tạo hàng đợi chứa các đỉnh tràn 

Queue.front := 0; 

Queue.rear := -1; 

Queue.nltems := 0; //Hàng đợi rỗng 
for V := 1 to n do //Duyệt tập đỉnh 

if (v <> s) and (v <> t) and (excess[v] > 0) then 

//v tràn 
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PushToQueue (v) ; //đẩy V vào hàng đợi 

end; 

procedure Push (i : I nteger) ; //Phép đấy luồng theo cung e[i] 

var Delta: Integer; 

begin 

with e[i] do 

if excess [x] < c - f then Delta := excess[x] 
else Delta := c - f; 

Inc(e[i].f, Delta); 

Dec(e[-i].f, Delta); 

with e[i] do 
begin 

Dec(excess [x], Delta); 

Inc(excess[ỵ], Delta); 

end; 

end; 

procedure SetH(u: Integer; NewH: Integer); 

//Đặt độ cao của u thành NewH, đồng bộ hóa mảng count 

begin 

Dec(count [h [u]]); 
h[u] := NewH; 

Inc(count[NewH]); 

end; 

procedure PertormGapHeuristic(gap: Integer); 

//Đấy nhãn theo khe gap 

var v: Integer; 

begin 

if (0 < gap) and (gap < n) and (count[gapl = 0) then 

//gap đúng là khe thật 

for V := 1 to n do 

if (v <> s) and (gap < h[v]) and (h[v] <= n) then 
begin 

SetH( V, n + 1); 
current[v] := head[v]; 

//Nâng độ cao của V cần phải cập nhật lại con trỏ currentỊv] 

end; 

end; 

procedure Lift(u: Integer) ; //Phép nâng đỉnh u 

var minH, OldH, i: Integer; 
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begin 

minH := 2 * maxN; 
i := head[u] ; 

while i <> 0 do //Duyệt các cung đi ra khỏi u 
begin 

with e[i] do 

if (c > f) and (h[y] < minH) then 

//Gặp cung thặng dư (u, v), ghi nhận đỉnh V thấp nhát 

minH := h [y] ; 
i := link[i]; 

end; 

OldH := h[u]; //NhớIạihỊu]cũ 
SetH(u, minH + 1); //nâng cao đỉnh u 

PerformGapHeuristic (OldH) ; //Có thể tạo ra khe OldH, đẩy nhãn theo khe 
end; 

procedure FIFOPreflowPush; //Thuật toán FIFO Preflow-Push 
var 

NeedQueue: Boolean; 
z: Integer; 

begin 

while Queue.nltems > 0 do //Chừng nào hàng đợi vẫn còn đỉnh tràn 
begin 

z := PopFromQueue ; //Lấy một đỉnh tràn X khỏi hàng đợi 
while current [z] <> 0 do //Xét một cung đi ra khỏi X 

begin 

with e[current[z]] do 

begin 

if (c > f) and (h [ X] > h[y]) then 

//Nếu có thể đẩy luồng được theo cung (u, v) 

begin 

NeedQueue := (y <> s) and (y <> t) 

and (excess [y] = 0); 
Push (current [z] ) ; //Đẩy luồng luôn 
if NeedQueue then 

//v đang không tràn sau phép đấy trở thành tràn 

PushToQueue (y) ; //Đẩy V vào hàng đợi 
if excess[z] = 0 then Break; 

//x hết tràn thì chuyến qua xét đỉnh khác ngay 
end; 
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end; 

current[z] := link [current [z]]; 

//x chưa hết tràn thì chuyến sang xét cung liên thuộc tiếp theo 
end; 

if excess [ z ] > 0 then //Duyệt hết danh sách liên thuộc màX vẫn tràn 

begin 

L i f t ( z ) ; //Năng cao X 

current[z] := head[z]; 

//Đặt con trỏ current[x] trỏ lại về đầu danh sách liên thuộc 
PushToQueue(z) ; //Đẩy lại X vào hàng đợi chờ xử lý sau 

end; 

end; 

FlowValue := excess[t]; 

//Thuật toán kết thúc, giá trị luồng bằng tống luồng đi vào đỉnh thu (= - excessỊs]) 
end; 

procedure PrintResult; //In kết quả 
var i: Integer; 

begin 

WriteLn('Maximum flow: '); 

for i := 1 to m do 
with e[i] do 

if f > 0 then //Chỉ cần in ra các cung có luồng > 0 

WriteLn ( 'e [ ', i, '] = (', X, 

= c, f = 

WriteLn('Value of flow: FlowValue); 

end; 
begin 

Enter; //Nhập dữ liệu 
I n i t ; //Khởi tạo 

FIFOPref lowPush; //Thực hiện thuậttoán đẩy tiền luồng 
PrintResult; //ỉnkếtquă 

end. 

Định lý 3-19 (định lý về tính nguyên) 

Neu tất cả các sức chứa là số nguyên thì thuật toán Ford-Fulkerson cũng nhu 
thuật toán đẩy tiền luồng luôn tìm đuợc luồng cực đại với luồng trên cung là các 
số nguyên. 


ỵ, ') : c 
' , f) ; 
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Chứng minh 

Đối với thuật toán Ford-Fulkerson, ban đầu ta khởi tạo luồng 0 thì luồng trên các 
cung là nguyên. Mồi lần tăng luồng dọc theo đường tăng luồng p. luồng trên mỗi 
cung hoặc giữ nguyên, hoặc tăng/giảm một lượng A p cũng là số nguyên. Vậy nên 
cuối cùng luồng cực đại phải có giá trị nguyên trên tất cả các cung. 

Đối với thuật toán đấy tiền luồng, ban đầu ta khởi tạo một tiền luồng trên các cung 
là số nguyên. Phép Lift và Push không làm thay đối tính nguyên của tiền luồng 
trên các cung. Vậy nên khi thuật toán kết thúc, tiền luồng trở thành luồng cực đại 
với giá trị luồng trên các cung là số nguyên. 

3.4. Một số mở rộng và ứng dụng của luồng 
a) Mạng với nhiều đỉnh phát và nhiều đỉnh thu 

Ta mở rộng khái niệm mạng bằng cách cho phép mạng G cổ p đỉnh phát: 
s 1 ,s 2 , —,Sp và q đỉnh thu t 1 ,t 2 , — ,t q , các đỉnh phát và các đỉnh thu hoàn toàn 
phân biệt. Hàm sức chứa và luồng trên mạng đuợc định nghĩa tuong tự nhu 
trong truờng hợp mạng có một đỉnh phát và một đỉnh thu. Giá trị của luồng đuợc 
định nghĩa bằng tổng luồng trên các cung đi ra khỏi các đỉnh phát. Bài toán đặt 
ra là tìm luồng cực đại trên mạng có nhiều đỉnh phát và nhiều đỉnh thu. 

Thêm vào mạng hai đỉnh: một siêu đỉnh phát 5 và siêu đỉnh thu t. Thêm các 
cung nối từ s tới các đỉnh Sj có sức chứa +00, thêm các cung nối từ các đỉnh tj 
tới t với sức chứa +00. Ta đuợc một mạng mới G' — (y, E') (h.2.9). 



Hình 2.9. Mạng với nhiều đỉnh phát và nhiều đỉnh thu 

CÓ thể thấy rằng nếu / là một luồng cực đại trên G', thì / hạn chế trên G cũng là 
luồng cực đại trên G. Vậy đế tìm luồng cực đại trên G, ta sẽ tìm luồng cực đại 
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trên G' rồi loại bỏ siêu đỉnh phát s, siêu đỉnh thu t và tất cả những cung giả mới 
thêm vào. 

Một cách khác có thể thực hiện đế tìm luồng trên mạng có nhiều đỉnh phát và 
nhiều đỉnh thu là loại bỏ tất các các cung đi vào các đỉnh phát cũng nhu các 
cung đi ra khỏi các đỉnh thu. Chập tất cả các đỉnh phát thành một siêu đỉnh 5 và 
chập tất cả các đỉnh thu lại thành một siêu đỉnh thu t, mạng không còn các đỉnh 
s 1 ,s 2 ,..,s p và t 1 ,t 2 , nữa mà chỉ có thêm đỉnh phát 5 và đỉnh thu t. Trên 
mạng ban đầu, mỗi cung đi vào/ra Sj đuợc chỉnh lại đầu mút đế nó đi vào/ra đỉnh 
s, mồi cung đi vào/ra tj cũng đuợc chỉnh lại đầu mút đế nó đi vào/ra đỉnh t, ta 
đuợc một mạng mới G". 

Khi đó ta ta có thể tìm / là một luồng cực đại trên G" và khôi phục lại đầu mút 
của các cung nhu cũ đế / trở thành luồng cực đại trên G. 

b) Mạng với sức chứa trên cả các đỉnh và các cung 

Cho mạng G — ( V, E, c, s, t), mỗi đỉnh V E V — {s,t} đuợc gán một số không âm 
d(v ) gọi là sức chứa của đỉnh đó. Luồng duong (Ọ trên mạng này đuợc định 
nghĩa với tất cả các ràng buộc của luồng duong và thêm một điều kiện: Tổng 
luồng duong trên các cung đi vào mồi đỉnh V EV — {s,t} không đuợc vượt quá 
d(v): ZeEẼ-(v) <p( e ) ^ d(v). Bài toán đặt ra là tìm luồng dưong cực đại trên 
mạng có ràng buộc sức chứa trên cả các đỉnh và các cung. 

Tách mồi đỉnh xE7-(s,t} thành 2 đỉnh mới x in , x out và một cung (x ín , x out ) 
với sức chứa d(x). Các cung đi vào X được chỉnh lại đầu mút đế đi vào x in và 
các cung đi ra khỏi X được chỉnh lại đầu mút đế đi ra khỏi x out (h.2.10). Ta xây 
dựng được mạng G' — (V',E') với đỉnh phát s và đỉnh thu t. 








Ly XZÁ 


d(x) 


Hình 2.10. Tách đỉnh 
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Khi đó việc tìm luồng dương cực đại trên mạng G có thể thực hiện bằng cách 
tìm luồng dương cực đại trên mạng G' , sau đó chập tất cả các cặp ( x in ,x out ) trở 
lại thành đỉnh X (Vx EK-Ịs, t}) đế khôi phục lại mạng G ban đầu. 

c) Mạng với ràng buộc luồng dương bị chặn hai phía 

Cho mạng G — (y, E, c, s, t ) trong đó mỗi cung e E E ngoài sức chứa (lưu 
lượng) tối đa c(e) còn được gán một số không âm đ(e) < c(e) gọi là lưu lượng 
tối thiếu. Một luồng dương tương thích (p trên G được định nghĩa với tất cả các 
ràng buộc của luồng dương và thêm một điều kiện: Luồng dương trên mỗi cung 
e E E không được nhỏ hơn sức chứa tối thiểu của cung đó: 

đ(e) < <p(e) < c(e) 

Bài toán đặt ra là kiểm chứng sự tồn tại của luồng dương tương thích trên mạng 
với ràng buộc luồng dương bị chặn hai phía. 

Xây dựng một mạng G' — (y',E r ) từ mạng G theo quy tắc: 

• Tập đỉnh V' có được từ tập V thêm vào đỉnh phát giả s' và đỉnh thu giả t'\ 
V' = v + {s',t'}. 

• Mỗi cung e — (u,v) E E sẽ tương ứng với ba cung trên E': cung e x — (lí, v) 
có sức chứa c(e) — d(e), cung e 2 — (s' , V ) và cung e 3 = (lí, t') có sức chứa 
đ(e). Ngoài ra thêm vào cung (t, s) E E' với sức chứa +00 


+oo 



Gọi D — X eEE d(e) là tống sức chứa tối thiếu của các cung trên mạng G. Khi đó 
trên mạng G ', tống sức chứa các cung đi ra khỏi s' cũng như tống sức chứa các 
cung đi vào t' bằng D. Vì vậy với mọi luồng dương trên G' thì giá trị luồng đó 
không thế vượt quá D. 
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Từ đó suy ra rằng nếu tồn tại một luồng duơng ạy trên G' có giá trị luồng 
\q)'\ — D thì cp' bắt buộc là luồng duơng cực đại trên G'. 

Bổ đề 3-20 cho phép ta kiểm chứng sự tồn tại luồng duơng tuơng thích trên G 
bằng việc đo giá trị luồng cực đại trên G'. 

BỐ đề 3-20 

Điều kiện cần và đủ đế tồn tại luồng duong tuong thích (p trên mạng G là tồn tại 
luồng duong cực đại cp' trên G' với giá trị luồng \ự)'\ — D. 

Chứng minh 

Giả sử luồng dương cực đại cp' trên G' có \(p\ = D = 2ee E đ(e). Ta xây dựng 
luồng (p trên G bằng cách cộng thêm vào luồng < 7 / trên mỗi cung e một lượng 
đ(e): 

<p-.E -» [0, + 00 ) 

e —> (p(e ) = (p'(e ) + đ(e) 

Khi đó có thế dễ dàng kiếm chứng được (p thỏa mãn tất cả các ràng buộc của 
luồng dương tương thích trên mạng G. 

Ngược lại nếu (Ọ là một luồng dương tương thích trên G. Ta xây dựng luồng 
dương (p' trên G' bằng cách trừ luồng (p trên mỗi cung e đi một lượng đ(e), đồng 
thời đặt luồng cp' trên các cung đi ra khỏi s' cũng như trên các cung đi vào ủ' đúng 
bằng sức chứa của cung đó. Khi đó cũng dễ dàng kiểm chứng được < 7 / là luồng 
dương cực đại và \(p\ — D. 

d) Mạng với sức chứa âm 

Cho mạng G — (V, E, c, w, s, t ) trong đó ta mở rộng khái niệm sức chứa bằng 
cách cho phép cả những sức chứa âm trên một số cung. Khái niệm luồng đuợc 
định nghĩa nhu bình thuờng. 

Neu nhu có thể khởi tạo đuợc một luồng thì thuật toán Ford-Fulkerson vẫn hoạt 
động đúng đế tìm luồng cực đại trên mạng có sức chứa âm. vấn đề khởi tạo một 
luồng bất kỳ trên mạng không phải đon giản vì chúng ta không thế khởi tạo bằng 
luồng 0, bởi nếu nhu vậy, ràng buộc sức chứa tối đa sẽ bị vi phạm trên các cung 
có sức chứa âm. 

Giả sử một cung e E E có sức chứa c(e) < 0. Theo tính đối xứng lệch của luồng 
/(e) = —/(—e) và ràng buộc sức chứa tối đa /(e) < c(e), ta có: 
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/(-e) = —/(e) > —c(e) > 0 


(3.5) 


Như vậy ràng buộc sức chứa tối đa /(e) < c(e) tương đương với ràng buộc về 
sức chứa tối thiếu - c(e) trên cung đối - e. Việc chỉ ra một luồng bất kỳ trên G 
có thế thực hiện bằng cách tìm luồng dương trên mạng với ràng buộc luồng 
dương bị chặn hai phía sau đó biến đối luồng dương này thảnh luồng cần tìm. 

e) Lát cắt hẹp nhất 

Ta quan tâm tới đồ thị vô hướng liên thông G — ( V,E ) với hàm trọng số (hay 
lưu lượng) c:E -* [0, +oo). Giả sử \v\ > 2, người ta muốn bỏ đi một số cạnh đế 
đồ thị mất tính liên thông và yêu cầu tìm phương án sao cho tổng trọng số các 
cạnh bị loại bỏ là nhỏ nhất. 

Bài toán cũng có thể phát biểu dưới dạng: hãy phân hoạch tập đỉnh V thành hai 
tập khác rồng rời nhau X và Y sao cho tống lưu lượng các cạnh nối giữa X và Y 
là nhỏ nhất có thể. Cách phân hoạch này gọi là lát cắt tống quát hẹp nhất của G, 
ký hiệu MinCut(G). 

c(X,Y ) -> min 

X * 0)Y * 0] X n Y = 0] X u Y = V) 

Một cách tệ nhất có thế thực hiện là thử tất cả các cặp đỉnh s, t. Với mỗi lần thử 
ta cho s làm đỉnh phát và t làm đỉnh thu trên mạng G, sau đó tìm luồng cực đại 
và lát cắt s — t hẹp nhất. Cuối cùng là chọn lát cắt s — t có lưu lượng nhỏ nhất 

trong tất cả các lần thử. Phương pháp này cần Q) = nx ^ — lần tìm luồng cực 
đại, có tốc độ chậm và không khả thi với dữ liệu lớn. 

Bổ đề 3-21 

Với s và t là hai đỉnh bất kỳ. Từ đồ thị G, ta xây dựng đồ thị G st bằng cách chập 
hai đỉnh s và t thành một đỉnh duy nhất, ký hiệu st, các cạnh nối s với t bị hủy 
bỏ, các cạnh liên thuộc với chỉ X hoặc t được chỉnh lại đầu mút đế trở thảnh 
cạnh liên thuộc với st. Khi đó MinCut(G) có thể thu được bằng lấy lát cắt có 
lưu lượng nhỏ nhất trong hai lát cắt: 
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• Lát cắt 5 — t hẹp nhất: Coi s là đỉnh phát và t là đỉnh thu, lát cắt 5 — t hẹp 
nhất có thể xác định bằng việc giải quyết bài toán luồng cực đại trên mạng 
G. 

• Lát cắt tổng quát hẹp nhất trên G st : MinCut^G st ). 

Chứng minh 

Xét lát cắt tong quát hẹp nhất trên G có thế đưa s và t vào hai thành phần liên 
thông khác nhau hoặc đưa chúng vào cùng một thành phần liên thông. Trong 
trường họp thứ nhất, MinCut(G ) là lát cắt s — t hẹp nhất. Trong trường họp thứ 
hai, MinCut(G') là MinCut(G st ). 

BỔ đề 3-21 cho phép chúng ta xây dựng một thuật toán tốt hon: Nấu đồ thị chỉ 
gồm 2 đỉnh thì chỉ việc cắt rời hai đỉnh vào hai tập. Neu không, ta chọn hai đỉnh 
bất kỳ s, t làm đỉnh phát và đỉnh thu, tìm luồng cực đại và ghi nhận lát cắt s — t 
hẹp nhất. Tiếp theo ta chập hai đỉnh s, t thành một đỉnh st và lặp lại với đồ thị 
G st ... Cuối cùng là chỉ ra lát cắt s — t hẹp nhất trong số tất cả các lát cắt đuợc 
ghi nhận. Phuong pháp này đòi hỏi phải thực hiện |L| — 1 lần tìm luồng cực 
đại, tuy đã có sự cải thiện về tốc độ nhung chua phải thật tốt. 

Nhận xét rằng tại mỗi buớc của cách giải trên, chúng ta có thế chọn hai đỉnh s, t 
bất kỳ miễn sao 5 ^ t. Vì vậy nguời ta muốn tìm một cách chọn cặp đỉnh s, t 
một cách hợp lý tại mồi buớc đế có thế chỉ ra ngay lát cắt s — t hẹp nhất mà 
không cần tìm luồng cực đại. Thuật toán duới đây [37] là một trong những thuật 
toán hiệu quả dựa trên ý tuởng đó. 

Với A là một tập con của tập đỉnh V và X là một đỉnh không thuộc A. Định nghĩa 
lực hút của A đối với X là tổng trọng số các cạnh nối X với các đỉnh thuộc A: 

c(4{x})= ^ c(e) 

e=(x,y)eE 

yẻA 

BỔ đề 3-22 

Bắt đầu từ tập A chỉ gồm một đỉnh bất kỳ a G V, ta cứ tìm một đỉnh bị A hút 
chặt nhất kết nạp thêm vào A cho tới khi A — V. Gọi s và t là hai đỉnh đuợc kết 
nạp cuối cùng theo cách này. Khi đó lát cắt (V — {t}, {t}) là lát cắt s — t hẹp 
nhất. 


221 


Chứng minh 

Xét một lát cắt s — t bất kỳ K, ta sẽ chứng minh rằng lưu lượng của lát cắt 
(y — {t}, {t}) không lớn hơn lưu lượng của lát cắt K. 

Một đình 17 được gọi là đinh hoạt tính nếu V và đình được đưa vào A liền trước V 
bị rơi vào hai phía của lát cắt K. Gọi A v là tập các đỉnh được kết nạp vào A trước 
đinh V, K v là lát cắt K hạn chế trên A v u { V } (Lát cắt K v dùng đúng cách phân 
hoạch của lát cắt K nhưng chỉ quan tâm tới tập đình A v u {ư}). Gọi c(k) là lưu 
lượng của lát cắt K, c(k v ) là lưu lượng của lát cắt K v . 

Trước hết ta sử dụng phép quy nạp đế chì ra rằng nếu u là đinh hoạt tính thì: 

c(A u ,{u}) < c(kJ (3.6) 

Neu u là đỉnh hoạt tính đầu tiên được kết nạp vào A, lát cắt K u sẽ chia tập 
A u u {li} làm hai tập, một tập là A u và một tập là (u), khi đó ta có c(A u , {u}) cũng 
chính là c(k u ). Giả thiết rằng bất đắng thức (3.6) đúng với đỉnh hoạt tính u, ta sẽ 
chứng nó cũng đúng với những đỉnh hoạt tính V được kết nạp vào A sau u. Thật 
vậy, 

c(A v , M) = c(A u , M) + c(A v - A u , M) (3.7) 

Do A u phải hút u mạnh hơn 17, kết hợp với giả thiết quy nạp, ta có: 

c(A u ,{v }) < cG4 u ,{u}) < c(k u ) 

Hạng tử c(A v — A u , { 17 }) là tong trọng số các cạnh nối giữa 17 và A v — A u . Do u và 
17 là hai đinh hoạt tính liên tiếp, các cạnh này sẽ nối giữa hai phía của lát cắt K v và 
có đóng góp trong phép tính c(k„), mặt khác do 17 Ệ A u u (u) nên những cạnh này 
không đóng góp trong phép tính c(k u ). Vậy từ công thức (3.7), ta suy ra: 

c{A v ,{v}) = c(Ấ u ,{i7}) + c(A v - A u ,{ 17}) 

< c(k u ) + c(A v -A u ,{v}) (3.8) 

^ c(kJ 

Vì K là một lát cắt s — t nên chắc chắn s và t nằm ở hai phía khác nhau của lát cắt 
K, hay nói cách khác, t là đình hoạt tính. Bất đang thức (3.6) chứng minh ở trên 
cho ta kết quả: 

c(V-{t},{t}) = c(A tl {t}) 

< c(K t ) (3.9) 

= c(k) 

Ta chứng minh được lát cắt (V — {t}, {t}) là lát cắt s — t hẹp nhất. 
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Định lý 3-23 

Việc tìm lát cắt tống quát trên đồ thị vô hướng liên thông với hàm trọng số 
không âm có thế được thực hiện bằng thuật toán trong thời gian 0(1 v \ 2 log|b| + 
\V\\E\). 

Chứng minh 

Bắt đầu từ tập A chỉ gồm một đinh bất kỳ, ta mở rộng A bằng cách lần lượt kết nạp 
vào A đỉnh bị hút chặt nhất cho tới khi A = V. Việc này được thực hiện với kỹ 
thưật tương tự như thuật toán Prim: với Vv Ệ. A, ta ký hiệu nhãn d[v] là lực hút 
của A đối với đinh V. khi A được kết nạp thêm một u thì các nhãn lực hút của 
những đinh V khác sẽ được cập nhật lại theo công thức: 

d[ư] mớ i := đMcũ + c(u, v),V(u, v) e E 

Bằng việc to chức các đinh ngoài A trong một hàng đợi ưu tiên dạng Fibonacci 
Heap, việc mở rộng tập A cho tới khi A — V được thực hiện trong thời gian 
0(|I/| log|k| + |£|). Trong quá trình đó, s và t là hai đinh cuối cùng được kết nạp 
vào A cũng được xác định và MinCut(G) được cập nhật theo lát cắt s — t hẹp 
nhất. Sau đó hai đinh s, t được chập vào và thuật toán lặp lại với đồ thị G st . Tống 
cộng ta có \v\ — 1 lân lặp, suy ra lát căt tông quát hẹp nhất có thê tìm được trong 
thời gian 0(IV1 2 log|l/| + |k||£'|). 

Mặc dù tính đúng đắng của thuật toán được chứng minh dựa vào lý thuyết về 
luồng cực đại và lát cắt hẹp nhất, việc cài đặt thuật toán lại khá đơn giản và không 
động chạm gì đến luồng cực đại. 


Bài tập 

2.27. Cho /i và /2 là hai luồng trên mạng G — ( V, E, c, s, t ) và a là một số thực 
nằm trong đoạn [0,1]. Xét ánh xạ: 

f a : E -> M 

e •-» /a(e) = af i(e) + (1 - a)/ 2 (e) 

Chứng minh rằng f a cũng là một luồng trên mạng G với giá trị luồng: 

\fa\ = «l/il + (1 - <01/21 

2.28. Cho / là một luồng trên mạng G — ( V,E,c,s,t ), chứng minh rằng với 
Ve G E, ta có: 
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Cf(e ) + cy(—e) — c(e) + c(—e) 

2.29. Cho / là luồng cực đại trên mạng G — (V, E, c, s, t), gọi Y là tập các đỉnh 
đến được t bằng một đường thặng dư trên Gf và X — V — Y. Chứng minh 
rằng ( X, Y) là lát cắt 5 — t hẹp nhất của mạng G. 

2.30. Viết chương trình nhận vào một đồ thị có hướng G — (V,E) với hai đỉnh 
phân biệt s và t và tìm một tập gồm nhiều đường đi nhất từ s tới t sao cho 
các đường đi trong tập này đôi một không có cạnh chung. 

Gợi ỷ 

Coi s là đỉnh phát và t là đỉnh thu, các cung đều có sức chứa 1. Tìm luồng 
cực đại trên mạng bằng thuật toán Ford-Fulkerson, theo Định lý 3-19 (định 
lý về tính nguyên), luồng trên các cung chỉ có thế là 0 hoặc 1. Loại bỏ các 
cung có luồng 0 và chỉ giữ lại các cung có luồng 1. Tiếp theo ta tìm một 
đường đi từ s tới t, chọn đường đi này vào tập hợp, loại bỏ tất cả các cung 
dọc trên đường đi này khỏi đồ thị và lặp lại..., thuật toán sẽ kết thúc khi đồ 
thị không còn cạnh nào (không còn đường đi từ s tới t). 

về kỹ thuật cài đặt, ta có thể tìm một đường đi từ s tới t trên đồ thị G, đảo 
chiều tất cả các cung trên đường đi này và lặp lại cho tới khi không còn 
đường đi từ s tới t nữa. Có thế thấy rằng đồ thị G tại mỗi bước chính là đồ 
thị các cung thặng dư và đường đi tìm được ở mỗi bước chính là đường 
tăng luồng. 

Đồ thị G giờ đây không còn đường đi từ s tới t, ta tìm một đường đi từ t 
về s, kết nạp đường đi theo chiều ngược lại (từ s tới t ) vào tập hợp, xóa bỏ 
tất cả các cung trên đường đi và cứ tiếp tục như vậy cho tới khi không còn 
đường đi từ t về s nữa. 

2.31. Tương tự như Bài tập 2.29 nhưng yêu cầu thực hiện trên đồ thị vô hướng. 

2.32. (Hệ đại diện phân biệt) Một lớp học có n bạn nam và n bạn nữ. Nhân ngày 
8/3, lóp có mua m món quà để các bạn nam tặng các bạn nữ. Mỗi món quà 
có thế thuộc sở thích của một số bạn trong lớp. 

Hãy lập chương trình tìm cách phân công tặng quà thỏa mãn: 
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• Mồi bạn nam phải tặng quà cho đúng một bạn nữ và mồi bạn nữ phải nhận 
quà của đúng một bạn nam. Món quà được tặng phải thuộc sở thích của cả 
hai người. 

• Món quà nào đã được một bạn nam chọn để tặng thì bạn nam khác không 
được chọn nữa. 

Gợi ý: Xây dựng một mạng trong đó tập đỉnh V gồm 3 lớp đỉnh s, X và T: 

• Lớp đỉnh phát s — {s 1( s 2 ,..., s n }, mỗi đỉnh tưong ứng với một bạn nam. 

• Lớp đỉnh X — (x 1 , x 2 ,..., x n ) mỗi đỉnh tưong ứng với một món quà. 

• Lớp đỉnh thu T — (íy, t 2 ,..., t n } mỗi đỉnh tưong ứng với một bạn nữ. 

Neu bạn nam i thích món quà k, ta cho cung nối từ Sj tới x k , nếu bạn nữ i 
thích món quà k, ta cho cung nối từ x k tới tj. Sức chứa của các cung đặt 
bằng 1 và sức chứa của các đỉnh v 1 ,v 2 , ...,v n cũng đặt bằng 1. Tìm luồng 
nguyên cực đại trên mạng G có n đỉnh phát, n đỉnh thu, đồng thời có cả 
ràng buộc sức chứa trên các đỉnh, những cung có luồng 1 sẽ nối giữa một 
món quà và người tặng/nhận tưong ứng. 

2.33. Cho mạng điện gồm m X n điểm nằm trên một lưới m ° 

hàng, n cột. Một số điểm nằm trên biên của lưới là ° 
nguồn điện, một số điếm trên lưới là các thiết bị sử ° 
dụng điện. Người ta chỉ cho phép nối dây điện giữa ° ° 9 9 ° 9 

hai điểm nằm cùng hàng hoặc cùng cột. Hãy tìm cách ° 9 9 9 ° • 

đặt các dây điện nối các thiết bị sử dụng điện với o • • • Q o 

nguồn điện sao cho hai đường dây bất kỳ nối hai thiết bị sử dụng điện với 
nguồn điện tưong ứng của chúng không được có điểm chung. 

2.34. (Kỳ thuật giãn sức chứa) Cho mạng G — (y, E, c, w, s, t ) với sức chứa 
nguyên: c: E N. Gọi c ■— max eE £ c(e). 

a) Chứng minh rằng lát cắt 5 — t hẹp nhất của G có lưu lượng không vượt 
quá C\E\ 

b) Với một số nguyên k, tìm thuật toán xác định đường tăng luồng có giá 
trị thặng dư > k trong thời gian Odcl). 

c) Chứng minh rằng thuật toán sau đây tìm được luồng cực đại trên mạng 
G: 
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procedure MaxFlowByScaling; 

begin 

f := «Luồng 0»; 

k : = c; //k là sức chứa lớn nhất của một cung trong E 

while k > 1 do 
begin 

Víhile «Tìm được đường tăng luồng p 
có giá trị thặng dư > k» do 
«Tăng luồng dọc theo đường p»; 
k := k div 2; 

end; 

end; 

d) Chứng minh rằng khi bước vào mồi lượt lặp của vòng lặp: 

vrhỉle k > 1 do. . . 

Lưu lượng của lát cắt hẹp nhất trên mạng thặng dư Gf không vượt quá 

2k\E\. 

e) Chứng minh rằng trong mồi lượt lặp của vòng lặp: 

Víhile k > 1 do. . . 

Vòng lặp while bên trong thực hiện 0(£■) lần với mồi giá trị của k. 

f) Chứng minh rằng thuật toán trên (maxỉmum flow by scaling) có thể cài 
đặt để tìm luồng cực đại trên G trong thời gian 0(|£'| 2 log c ). 

4. Bộ ghép cực đại trên đồ thị hai phía 

4.1. Đồ thị hai phía 

Đồ thị vô hướng G — ( V, E ) được gọi là đồ thị hai phía nếu tập đỉnh V của nó có 
thể chia làm hai tập con rời nhau: X và Y sao cho mọi cạnh của đồ thị đều nối 
một đỉnh thuộc X với một đỉnh thuộc Y. Khi đó người ta còn ký hiệu G — 
(V u Y,E ). Đe thuận tiên trong trình bày, ta gọi các đỉnh thuộc X là các V đỉnh 
và các đỉnh thuộc Y là các L đỉnh. 
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X Y 

Hình 2.12. Đồ thị hai phía 


Một đồ thị vô hướng là đồ thị hai phía nếu và chỉ nếu từng thành phần liên thông 
của nó là đồ thị hai phía. Để kiểm tra một đồ thị vô hướng liên thông có phải đồ 
thị hai phía hay không, ta có thế sử dụng một thuật toán tìm kiếm trên đồ thị 
(BFS hoặc DFS) bắt đầu từ một đỉnh 5 bất kỳ. Đặt: 

X {tập các đỉnh đến được từ s qua một số chẵn cạnh} 

Y ■— (tập các đỉnh đến được từ s qua một số lẻ cạnh} 

Neu tồn tại cạnh của đồ thị nối hai đỉnh G X hoặc hai đỉnh G Y thì đồ thị đã cho 

không phải đồ thị hai phía, ngược lại đồ thị đã cho là đồ thị hai phía với cách 

phân hoạch tập đỉnh thành hai tập X, Y ở trên. 

Đồ thị hai phía gặp rất nhiều mô hình trong thực tế. Chẳng hạn quan hệ hôn 
nhân giữa tập những người đàn ông và tập những người đàn bà, việc sinh viên 
chọn trường, thầy giáo chọn tiết dạy trong thời khoá biếu v.v... 

4.2. Bài toán tìm bộ ghép cực đại trên đồ thị hai phía 

Cho đồ thị hai phía G — Ợỉ u Y, £■). Một bộ ghép (matching) của G là một tập 
các cạnh đôi một không có đỉnh chung. Có thể coi một bộ ghép là một tập 
M c E sao cho trên đồ thị (X u Y,M ), mỗi đỉnh có bậc không quá 1. 

Vấn đề đặt ra là tìm một bộ ghép lớn nhất (maximum matchỉng) (có nhiều cạnh 
nhất) trên đồ thị hai phía cho trước. 

4.3. Mô hình luồng 

Định hướng các cạnh của G thành cung từ X sang Y. Thêm vào đỉnh phát giả s 
và các cung nối từ s tới các V đỉnh, thêm vào đỉnh thu giả t và các cung nối từ 
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các Y_ăỉ nh tới t. Sức chứa của tất cả các cung được đặt bằng 1, ta được mạng 
G'. Xét một luồng trên mạng G' có luồng trên các cung là số nguyên, khi đó có 
thế thấy rằng những cung có luồng bằng 1 từ X sang Y sẽ tương ứng với một bộ 
ghép trên G. Bài toán tìm bộ ghép cực đại trên G có thế giải quyết bằng cách tìm 
luồng nguyên cực đại trên G'. 



Hình 2.13. Mô hình luồng của bài toán tìm bộ ghép cực đại trên đồ thị hai phía. 

Chúng ta sẽ phân tích một số đặc điểm của đường tăng luồng trong trường hợp 
này đế tìm ra một cách cài đặt đơn giản hơn. 

Xét đồ thị hai phía G — (X u Y, E) và một bộ ghép M trên G. 

• Những đỉnh thuộc M gọi là những đỉnh đã ghép (matched vertỉces), những 
đỉnh không thuộc M gọi là những đinh chưa ghép (;unmached vertỉces). 

• Những cạnh thuộc M gọi là những cạnh đã ghép, những cạnh không thuộc 
M được gọi là những cạnh chưa ghép. 

• Neu định hướng lại những cạnh của đồ thị thành cung: Những cạnh chưa 
ghép định hướng từ X sang Y, những cạnh đã ghép định hướng ngược lại từ 
Y về X. Trên đồ thị định hướng đó, một đường đi được gọi là đường pha 
(alternatỉng path) và một đường đi từ một X đỉnh chưa ghép tới một 
y_đỉnh chưa ghép gọi là một đường mở ( augmentỉngpath). 

Dọc trên một đường pha, các cạnh đã ghép và chưa ghép xen kẽ nhau. Đường 
mở cũng là một đường pha, đi qua một số lẻ cạnh, trong đó số cạnh chưa ghép 
nhiều hơn số cạnh đã ghép đúng một cạnh. 

Ví dụ với đồ thị hai phía trong hình 2.14 và một bộ ghép {(Vi,yi), (* *2<y2)}- 
Đường đi (x 3l y 2 ,x 2 ,y 1 ) là một đường pha, đường đi (x 3 ,y 2 ,x 2 ,y 1 ,x 1 ,y 3 ) là một 
đường mở. 
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Hình 2.14. Đồ thị hai phía và các cạnh được định hướng theo một bộ ghép 

Đường mở thực chất là đường tăng luồng với giá trị thặng dư 1 trên mô hình 
luồng. Định lý 3-11 (mối quan hệ giữa luồng cực đại, đường tăng luồng và lát 
cắt hẹp nhất) đã chỉ ra rằng điều kiện cần và đủ để một bộ ghép M là bộ ghép 
cực đại là không tồn tại đường mở ứng với M. 

Neu tồn tại đường mở p ứng với bộ ghép M, ta mở rộng bộ ghép bằng cách: dọc 
trên đường p loại bỏ những cạnh đã ghép khỏi M và thêm những cạnh chưa 
ghép vào M. Bộ ghép mới thu được sẽ có lực lượng nhiều hon bộ ghép cũ đúng 
một cạnh. Đây thực chất là phép tăng luồng dọc trên đường p trên mô hình 
luồng. 

4.4. Thuật toán đường mở 

Từ mô hình luồng của bài toán, chúng ta có thể xây dựng được thuật toán tìm bộ 
ghép cực đại dựa trên co chế tìm đường mở và tăng cặp: Thuật toán khởi tạo 
một bộ ghép bất kỳ trước khi bước vào vòng lặp chính. Tại mồi bước lặp, đường 
mở (thực chất là một đường đi từ một X đinh chưa ghép tới một T đỉnh chưa 
ghép) được tìm bằng BFS hoặc DFS và bộ ghép sẽ được mở rộng dựa trên 
đường mở tìm được. 

M := «Một bộ ghép bất kỳ, chẳng hạn: 0»; 
while «Tìm được đường mở p» do 

begin 

«Dọc trên đường P: 

- Loại bỏ những cạnh đã ghép khỏi M 

- Thêm những cạnh chưa ghép vào M 

» 

end; 
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Ví dụ với đồ thị trong hình 2.14 và bộ ghép M — {(Xi,yi), (x 2 ,y 2 )}, thuật toán sẽ 
tìm được đường mở: 

*3 ■--> y 2 z * 2 -> yi ^ -> y 3 

ỄAÍ e M 

Dọc trên đường mở này, ta loại bỏ hai cạnh (y 2 ,x 2 ) và {y í , Xị ) khỏi bộ ghép và 
thêm vào bộ ghép ba cạnh (x 3 ,y 2 ), (x 2 ,y 1 ), (x 1 ,y 3 ), được bộ ghép mới 3 cạnh. 
Đồ thị với bộ ghép mới không còn đinh chưa ghép (không còn đường mở) nên đây 
chính là bộ ghép cực đại (h.2.15). 



Hình 2.15. Mở rộng bộ ghép 


4.5. Cài đặt 

Chúng ta sẽ cài đặt thuật toán tìm bộ ghép cực đại trên đồ thị hai phía G — 
c X u Y, E), trong đó \x\ — p, \Y\ — q và \E\ — m. Các x_đỉnh được đánh số từ 
1 tới p và các y đỉnh được đánh số từ 1 tới < 7 - Khuôn dạng Input/Output như 
sau: 

Input 

• Dòng 1 chứa ba số nguyên dưong p, q, m lần lượt là số X đỉnh, số F_đỉnh 
và số cạnh của đồ thị hai phía. ( p, q < 10 4 ; m < 10 6 ). 

• m dòng tiếp theo, mồi dòng chứa hai số nguyên dưong i,j tưong ứng với 
một cạnh ( Xị,yj ) của đồ thị. 

Output 

Bộ ghép cực đại trên đồ thị. 
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Sample Input 

Sample Output 

3 3 5 

1: X[2] - y[1] 

3 2 

2: X [3] - y[2] 

2 2 

3: x[l] - y[3] 

2 1 


1 3 


1 1 




a) Biểu diễn đồ thị hai phía và bộ ghép 

Đồ thị hai phía G — (X u Y, E) sê được biếu diễn bằng cách danh sách kề của 
các X đíĩửì. Cụ thế là ta sẽ sử dụng mảng head[l ...p] với các phần tử ban đầu 
được kh ởi tạo bằng 0, mảng adj[ 1 ...m] và mảng link[ 1 Danh sách kề 

được xây dựng ngay trong quá trình đọc danh sách cạnh: mỗi khi đọc một cạnh 
e Ể = (x,y) ta gán adj[i] y, đặt link[i] ■■= headịx] sau đó cập nhật lại 
head[x] ■— i. Khi đọc xong danh sách cạnh thì danh sách kề cũng được xây 
dựng xong, khi đó đế duyệt các Tđỉnh kề với một đỉnh X E X, ta có thể sử dụng 
thuật toán sau: 

i := head [x] ; //Từ đầu danh sách móc nối các đỉnh kề X 

Víhile i Ỷ 0 do 
begin 

«xử lý đỉnh adj[i]»; 

i : = link [i ] ; //Nhảy sang phần tử kế tiếp trong danh sách móc noi 

end; 

Bộ ghép trên đồ thị hai phía được biểu diễn bởi mảng matchịl ... ny ], trong đó 
match\j] là chỉ số củaX đỉnh ghép với đỉnh ỵj. Neuy ; - là đỉnh chưa ghép, ta 
gán match\j] 0. 


b) Tìm đưởng mở 

Đường mở thực chất là một đường đi từ một X đinh chưa ghép tới một T đỉnh 
chưa ghép trên đồ thị định hướng. Ta sẽ tìm đường mở tại mồi bước bằng thuật 
toán DFS: 
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Bắt đầu từ một đỉnh X E X chưa ghép, trước hết ta đánh dấu các Tđỉnh bằng 
mảng availị 1...q] trong đó avail\j] — True nếu đỉnh yj G Y chưa thăm và 
avail\j] — False nếu đỉnh Yj G Y đã thăm (chỉ cần đánh dấu các Tđỉnh). 

Thuật toán DFS để tìm đường mở xuất phát từ X được thực hiện bằng một thủ 
tục đệ quy Visit(x ), thủ tục này sẽ quét tất cả những đỉnh y G Y chưa thăm nối 
từ X (dĩ nhiên qua một cạnh chưa ghép), với mỗi khi xét đến một đỉnh y G Y, 
trước hết ta đánh dấu thăm y. Sau đó: 

• Nếu y đã ghép, dựa vào sự kiện từ y chỉ đi đến được matchịy ] qua một 
cạnh đã ghép hướng từ Y về X, lời gọi đệ quy Visit(match[y]) được thực 
hiện đế thăm luôn đỉnh matchịy ] G X (thăm liền hai bước). 

• Ngược lại nếu y chưa ghép, tức là thuật toán DFS tìm được đường mở kết 
thúc ở y, ta thoát khỏi dây chuyền đệ quy. Quá trình thoát dây chuyền đệ 
quy thực chất là lần ngược đường mở, ta sẽ lợi dụng quá trình này đế mở 
rộng bộ ghép dựa trên đường mở. 

Đe thuật toán hoạt động hiệu quả hon, ta sử dụng liên tiếp các pha xử lý lô: Ký 
hiệu X* là tập các X ăỉnh chưa ghép, mỗi pha sẽ cố gắng mở rộng bộ ghép dựa 
trên không chỉ một mà nhiều đường mở không có đỉnh chung xuất phát từ các 
đỉnh khác nhau thuộc X*. Cụ thế là một pha sẽ khởi tạo mảng đánh dấu 
avail[ 1... q ] bởi giá trị True, sau đó quét tất cả những đỉnh X G X* , thử tìm 
đường mở xuất phát từ X và mở rộng bộ ghép nếu tìm ra đường mở. Trong một 
pha có thể có nhiều X ãỉnh được ghép thêm. 

procedure visit (x GX) ; //Thuật toán DFS 
begin 

for Vy: (x, ỵ)6E do //QuétcácY_đỉnhkềx 

if avail [ ỵ] then //y chua thăm, chú ý (x,y) chắc chắn là cạnh chua ghép 

begin 

avail [y] := False; //Đánh dấu thămy 

if match[y] = 0 then Found := True 

//y chưa ghép, dựng cờ báo tìm thấy đường mở 

else Vi sit (match [ y ] ) ; //y đã ghép, gọi đệ quy tiếp tục DFS 
if Found then //Ngay khi đường mở được tìm thấy 

begin 

match [y] := x; //Chỉnh lại bộ ghép theo đường mở 
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E X i t; //Thoát luôn, lệnh Exit đặt ở đây sẽ thoát cả dây chuyền đệ quy 
end; 

end; 

end; 

begin //Thuật toán tìm bộ ghép cực đại trên đỗ thị hai phía 

«Khởi tạo một bộ ghép bất kỳ, chẳng hạn 0»; 

X* := «Tập các đỉnh chưa ghép»; 

repeat //Lặp các pha xử lý theo lô 

01 d : = I X * I ; //Lưu số đỉnh chưa ghép khi bắt đầu pha 

for Vỵ GY do availty] := True; //Đánh dấu mọi Y đtnh chưa thăm 

for Vx G X* do 
begin 

Found := False; //Cờ báo chưa tìm thấy đường mở 
Vi s i t (X) ; //Tìm đường mở' bằng DFS 
if Found then X* := X* - {x}; 

//x đã được ghép, loại bỏ X khỏi X* 

end; 

until I X* I = 01 d; //Lặp cho tới khi không thể ghép thêm 
end; 

BMATCH.PAS s Tìm bộ ghép cực đại trên đồ thị hai phía 

{$MODE OBJFPC} 

program MaximumBipartiteMatching; 

const 

maxN = 10000; 
maxM = 1000000; 

var 

p, q, m: Integer; 
adj: array[1..maxM] of Integer; 
link: array[1..maxM] of Integer; 
head: array[1..maxN + 1] of Integer; 
match: array[1..maxN] of Integer; 
avail: array[1..maxN] of Boolean; 

List: array[1..maxN] of Integer; 
nList: Integer; 
procedure Enter; //Nhập dữ liệu 
var i, X, y: Integer; 
begin 




ReadLn(p, q, m); 

FillChar(head[1], p * SizeOf(head[1]), 0); 

f or i := 1 to m do 
begin 

Re a dL n (X , y) ; //Đọc một cạnh (x, y), đưa y vào danh sách kề của X 

adj[i] := y; 

link[i] := head[x]; 
head[x] := ì; 

end; 

end; 

procedure Init; //Khởi tạo bộ ghép rỗng 

var i: Integer; 

begin 

FillChar(matcht1], q * SizeOf(match[1]), 0); 
for i := 1 to p do List[i] := i; 

//Mảng List chứa nList x_đỉnh chưa ghép 
nList := p; 

end; 

procedure SuccessiveAugmentingPaths; 

var 

Found: Boolean; 

Old, i: Integer; 

procedure Visit(x: Integer) ; //Thuật toán DFS từ xeX 
var i, y: Integer; 

begin 

i := head[x]; //Từđầu danh sách kề của X 

vrhile i <> 0 do 
begin 

y := adj [i] ; //Xét một đỉnh y eY kề X 

i f a V ail [ y ] then //y chưa thăm, hiến nhiên (x,y) là cạnh chưa ghép 

begin 

avail [ỵ] := False; //Đánh dấu thăm y 

if match[y] = 0 then Found := True 

//y chưa ghép thì báo hiệu tìm thấy đường mở 
else Visit(match[y]); 

//Thăm luôn matchỊy] eX (thăm liền 2 bước) 
if Found then //Tìm thấy đường mở 

begin 

match[y] := x; //Chỉnh lại bộ ghép 
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Exit; //Thoát dây chuyển đệ quy 
end; 

end; 

i : = link [i] ; //Chuyến sang đỉnh kế tiếp trong danh sách các đỉnh kể X 

end; 

end; 

begin 

repeat 

Old := nList; //Lưu lại số x_đĩnh chua ghép 
FillChar(avail [1], q * SizeOf(avail[1]), True) ; 
for i := nList downto 1 do 
begỉn 

Found := False; 

Visit (List [i] ) ; //cố ghép List[i] 
if Found then //Nếughép được 

begin //Xóa List[i] khỏi danh sách các x_đỉnh chưa ghép 

List[i] := List[nList]; 

Dec (nList) ; 

end; 

end; 

until Old = nList; //Không thế ghép thêm x_đỉnh nào nữa 
end; 

procedure PrintResult; //In kết quả 

var j, k: Integer; 

begin 

k := 0; 

for j := 1 to q do 

if match[j] <> 0 then 
begin 

Inc(k); 

WriteLn(k, x[', match[j], '] - y[', j, 

end; 

end; 

begin 

Enter; 

Init; 

SuccessiveAugmentingPath; 

PrintResult; 
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end. 

Neu đồ thị có n đỉnh (n = p + q) và m cạnh, do mảng đánh dấu avail[ 1... q] 
chỉ được khởi tạo một lần trong pha, thời gian thực hiện của một pha sẽ bằng 
0(n + m ) (suy ra từ thời gian thực hiện giải thuật của DFS). 

Các pha sẽ được thực hiện lặp cho tới khi X* — 0 hoặc khi một pha thực hiện 
xong mà không ghép thêm được đỉnh nào. Thuật toán cần không quá p lần thực 
hiện pha xử lý lô, nên thời gian thực hiện giải thuật tìm bộ ghép cực đại trên đồ 
thị hai phía là 0(n 2 + nm) trong trường hợp xấu nhất. Còn trong trường hợp tốt 
nhất, ta có thế tìm được bộ ghép cực đại chỉ qua một lượt thực hiện pha xử lý lô, 
tức là bằng thời gian thực hiện giải thuật DFS. cần lưu ý rằng đây chỉ là những 
đánh giá 0 lớn về cận trên của thời gian thực hiện. Thuật toán này chạy rất 
nhanh trên thực tế nhưng hiện tại chưa có đánh giá nào chặt hon. 

Ý tưởng tìm một lúc nhiều đường mở không có đỉnh chung đã được nghiên cứu 
trong bài toán luồng cực đại bởi Dinic[10]. Dựa trên ý tưởng này, Hopcroữ và 
Karp[21] đã tìm ra thuật toán tìm bộ ghép cực đại trên đồ thị hai phía trong thời 

gian 0 (y I^IIeỘ. Thuật toán Hopcroft-Karp trước hết sử dụng BFS để phân lóp 

các đỉnh theo độ dài đường đi ngắn nhất sau đó mới sử dụng DFS trên rừng các 
cây BFS đê xử lý lô tưong tự như cách làm của chúng ta ở trên. 


Bài tập 

2.35. Có p thợ và q việc. Mồi thợ cho biết mình có thế làm được những việc 
nào, và mỗi việc khi giao cho một thợ thực hiện sẽ được hoàn thành xong 
trong đúng 1 đon vị thời gian. Tại một thời điểm, mồi thợ chỉ thực hiện 
không quá một việc. 

Hãy phân công các thợ làm các công việc sao cho: 

• Mồi việc chỉ giao cho đúng một thợ thực hiện. 

• Thời gian hoàn thành tất cả các công việc là nhỏ nhất. Chú ý là các thợ có 
thế thực hiện song song các công việc được giao, việc của ai người nấy làm, 
không ảnh hưởng tới người khác. 
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3.36. Một bộ ghép M trên đồ thị hai phía gọi là tối đại nếu việc bổ sung thêm bất 
cứ cạnh nào vào M sẽ làm cho M không còn là bộ ghép nữa. 

a) Chỉ ra một ví dụ về bộ ghép tối đại nhung không là bộ ghép cực đại trên 
đồ thị hai phía 

b) Tìm thuật toán 0(I £■ I) để xác định một bộ ghép tối đại trên đồ thị hai 
phía 

c) Chứng minh rằng nếu A và B là hai bộ ghép tối đại trên cùng một đồ thị 
hai phía thì |i4| < 2\B\ và |5| < 2\A\. Từ đó chỉ ra rằng nếu thuật toán 
đuờng mở đuợc khởi tạo bằng một bộ ghép tối đại thì số luợt tìm đuờng 
mở giảm đi ít nhất một nửa so với việc khởi tạo bằng bộ ghép rồng. 

3.37. (Phủ đỉnh - Vertex Cover) Cho đồ thị hai phía G — (X u Y,E). Bài toán 
đặt ra là hãy chọn ra một tập c gồm ít nhất các đỉnh sao cho mọi cạnh G E 
đều liên thuộc với ít nhất một đỉnh thuộc c. 

Bài toán tìm phủ đỉnh nhỏ nhất trên đồ thị tống quát là NP-đầy đủ, hiện tại 
chua có thuật toán đa thức đế giải quyết. Tuy vậy trên đồ thị hai phía, phủ 
đỉnh nhỏ nhất có thế tìm đuợc dựa trên bộ ghép cực đại. 

Dựa vào mô hình luồng của bài toán bộ ghép cực đại, giả sử các cung 
(X, Y) có sức chứa + 00 , các cung (s,x) và (ỵ, t) có sức chứa 1. Gọi (S,r) 
là lát cắt hẹp nhất của mạng. Đặt c — (x G T} u {y G 5}. 

a) Chứng minh rằng c là một phủ đỉnh 

b) Chứng minh rằng c là phủ đỉnh nhỏ nhất 

c) Giả sử ta tìm đuợc M là bộ ghép cực đại trên đồ thị hai phía, khi đó chắc 
chắn không còn tồn tại đuờng mở tưong ứng với bộ ghép M. Đặt: 

Y* — [y E Y\3x E X chua ghép, X đến đuợc y qua một đuờng pha} 

X* — {x E X: X đã ghép và đỉnh ghép với X không thuộc T*} 

Chứng minh rằng ( X*, Y*) là lát cắt hẹp nhất. 

d) Xây dựng thuật toán tìm phủ đỉnh nhỏ nhất trên đồ thị hai phía dựa trên 
thuật toán tìm bộ ghép cực đại. 

3.38. Cho M là một bộ ghép trên đồ thị hai phía G — (X u Y, E). Gọi k là số 
X đỉnh chua ghép. Chứng minh rằng ba mệnh đề sau đây là tuơng đuong: 
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• M là bộ ghép cực đại. 

• G không có đường mở tương ứng với bộ ghép M. 

• Tồn tại một tập con A củaX sao cho |tv(yl)| = |i4| — k. Ở đây N(Á) là tập 
các Tđỉnh kề với một đỉnh nào đó trong A (Gợi ỷ: Chọn A là tập các 
x_đỉnh đến được từ một x_đỉnh chưa ghép bằng một đường pha ) 

2.39. (Định lý Hall) Cho G — (X u Y, E) là đồ thị hai phía có |x| = |y|. Chứng 
minh rằng G có bộ ghép đầy đủ (bộ ghép mà mọi đỉnh đều được ghép) nếu 
và chỉ nếu |i4| < |A1(Ấ)| với mọi tập A Q X. 

2.40. (Phủ đường tối thiểu) Cho G — (V, E ) là đồ thị có hướng không có chu 
trình. Một phủ đường ( path cover ) là một tập p các đường đi trên G thỏa 
mãn: Với mọi đỉnh V G V, tồn tại duy nhất một đường đi trong p chứa V. 
Đường đi có thể bắt đầu và kết thúc ở bất cứ đâu, tính cả đường đi độ dài 0 
(chỉ gồm một đỉnh). Bài toán đặt ra là tìm phủ đường tối thiểu ( minimum 
path cover ): Phủ đường gồm ít đường đi nhất. 

Gọi n là số đỉnh của đồ thị, ta đánh số các đỉnh thuộc V từ 1 tới n. Xây 
dựng đồ thị hai phía G' — (X u Y,E ') trong đó: 

X = {x 1 ,x 2 , ...x n } 

y = {yi.yz.-yn} 

Tập cạnh E' được xây dựng như sau: Với mồi cung ( i,j ) G E, ta thêm vào 
một cạnh (xj,yy) G E' (h.2.16) 
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Pi = (1,3,5) 
p 2 = (2,4,6) 


Hình 2.16. Bài toán tìm phủ đường tối thiếu trên DAG có thế quy về bài toán bộ ghép cực đại trẽn đồ 

thị hai phía. 


Gọi M là một bộ ghép trên G'. Khởi tạo p là tập n đường đi, mồi đường đi 
chỉ gồm một đỉnh trong G, khi đó p là một phủ đường. Xét lần lượt các 
cạnh của bộ ghép, mồi khi xét tới cạnh (xj,y y ) ta đặt cạnh (i,j) nối hai 
đường đi trong p thành một đường.. .Khi thuật toán kết thúc, p vẫn là một 
phủ đường. 

a) Chứng minh tính bất biến vòng lặp: Tại mỗi bước khi xét tới cạnh 
(xj,y ; ) G M, cạnh (i,j) G E chắc chắn sẽ nối hai đường đi trong P: một 
đường đi kết thúc ở i và một đường đi khác bắt đầu ở j. Từ đó chỉ ra tính 
đúng đắn của thuật toán. (Gợi ỷ: mỗi khi xét tới cạnh (xj,y y ) G M và đặt 
cạnh (i,j) nối hai đường đi của p thành một đường thì \p\ giảm 1. Vậy khi 
thuật toán trên kết thúc, \p\ = n — \M\ , tức là muốn |p| -* min thì 
\M\ -» max). 

b) Viết chưong trình tìm phủ đường cực tiểu trên đồ thị có hướng không 
có chu trình. 

c) Chỉ ra ví dụ để thấy rằng thuật toán trên không đúng trong trường hợp G 
có chu trình. 

d) Chứng minh rằng nếu tìm được thuật toán giải bài toán tìm phủ đường 
cực tiểu trên đồ thị tống quát trong thời gian đa thức thì có thế tìm được 
đường đi Hamilton trên đồ thị đó (nếu có) trong thời gian đa thức. (Lý 
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thuyết về độ phức tạp tính toán đã chứng minh được rằng trên đồ thị tống 
quát, bài toán tìm đường đi Hamilton là NP-đầy đủ và bài toán tìm phủ 
đường cực tiểu là NP-khó. Có nghĩa là một thuật toán với độ phức tạp đa 
thức để giải quyết bài toán phủ đường cực tiếu trên đồ thị tống quát sẽ là 
một phát minh lớn và đáng ngạc nhiên). 

2.41. Tự tìm hiểu về thuật toán Hopcroft-Karp. Cài đặt và so sánh tốc độ thực tế 
với thuật toán trong bài. 

2.42. (Bộ ghép cực đại trên đồ thị chính quy hai phía) Một đồ thị vô hướng 
G — ( V, E) gọi là đồ thị chính quy bậc k ( k-regular graph ) nếu bậc của 
mọi đỉnh đều bằng k. Đồ thị chính quy bậc 0 là đồ thị không có cạnh nào, 
đồ thị chính quy bậc 1 thì các cạnh tạo thành bộ ghép đầy đủ, đồ thị chính 
quy bậc 2 có các thành phần liên thông là các chu trình đon. 

a) Chứng minh rằng đồ thị hai phía G — (X u Y, E) là đồ thị chính quy thì 

m = in 

b) Chứng minh rằng luôn tồn tại bộ ghép đầy đủ trên đồ thị hai phía chính 
quy bậc k (k > 1). 

c) Tìm thuật toán 0(\E\ loglcl) để tìm một bộ ghép đầy đủ trên đồ thị 
chính quy bậc k > 1. 
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